摘要: 本文介绍了一系列新的基础模型,称为 Llama 3。Llama 3 是一个语言模型群体,天生支持多语言、代码编写、推理和工具使用。我们最大的模型是一个具有 4050 亿个参数和高达 128,000 个标记的上下文窗口的密集型 Transformer。本文对 Llama 3 进行了一系列广泛的经验评估。结果表明,Llama 3 在许多任务上都能够达到与 GPT-4 等领先语言模型相当的质量。我们将 Llama 3 公开发布,包括预训练和后训练的 4050 亿参数语言模型,以及用于输入输出安全性的 L...【查看原文】