Meta发布Llama 3.1 称可与OpenAI和Anthropic等对手产品媲美

作者：雷递发布时间：2024-07-25

雷递网乐天 7月25日

社交网络Meta日前宣布发布其大型语言模型的最新版本Llama 3.1，Meta声称该模型目前可与OpenAI和Anthropic等竞争对手相媲美。

新模型发布仅三个月前，Meta刚将Llama 3整合到Meta AI中。

Meta AI是一款聊天机器人，已在Facebook、Messenger、Instagram和WhatsApp 中使用，还为该公司的智能眼镜提供支持。在此期间，OpenAI 和 Anthropic 已发布各自 AI 模型的新版本，这表明硅谷的 AI 军备竞赛不会很快放缓。

Meta表示，新模型名为Llama 3.1 405B，是第一个可以在常识、数学技能和跨多种语言翻译方面与竞争对手竞争的公开模型。

Meta声称，该模型在16,000 多个 NVIDIA H100 GPU上进行训练，这是目前最快的芯片，每个芯片售价约为 25,000 美元，可以在 150 多个基准测试中击败竞争对手。

“405B”代表4050亿个参数，这些参数是AI模型用于推理和决策的内部变量。AI模型的参数数量越多，我们认为它就越聪明。相比之下，据报道OpenAI的GPT-4模型拥有大约1.5万亿个参数，尽管该公司尚未透露具体数字。此外，Meta还发布了现有Llama模型的升级版，分别包含700亿和80亿个参数，并声称新版本具有更强的推理能力等。

开发人员可以从其官方网站下载Llama 3.1，而普通用户可以通过WhatsApp中的Meta AI或该公司聊天机器人网站meta.ai使用它。

“Llama 405B改进的推理能力使Meta AI能够理解和回答你更复杂的问题，尤其是在数学和编码方面，”Meta的博客文章指出。 “您可以通过分步解释和反馈获得数学作业方面的帮助，通过调试支持和优化更快地编写代码。”

目前，Facebook、Messenger 和 Instagram 上的 Meta AI 仍然仅限于使用 700 亿个参数的较小版本的 Llama 3.1。

与 OpenAI、谷歌、微软和 Anthropic 将其 AI 模型保持专有不同，Meta 的 AI 模型是开源的，这意味着任何人都可以免费修改和使用它们，而无需与 Meta 共享个人数据。

Meta首席执行官马克·扎克伯格在一封信中表示，AI开发的开源方法将确保更广泛地获得该技术的好处，防止权力集中在少数大公司手中，并使整个社会更安全地部署 AI。

扎克伯格称，通过开源该公司迄今为止最大的语言模型，Meta 旨在让 Llama 成为任何人开发人工智能应用和服务的“行业标准”。

开源人工智能模型并将其添加到数十亿人使用的现有产品中，可以让 Meta更有效地与OpenAI竞争，OpenAI 的 ChatGPT 和 DALL-E 聊天机器人在 2022 年推出时引发了人工智能热潮。它还可以提高参与度——Meta 今天宣布，用户很快就能将人工智能生成的图像直接添加到 Facebook、Messenger、WhatsApp 和 Instagram上的提要、故事、评论和消息中。

扎克伯格在信中还批评了苹果及其封闭的生态系统，认为这家 iPhone 制造商的限制性和武断政策限制了 Meta 在其平台上构建的内容。

扎克伯格说：“很明显，如果我们能够打造出最好的产品，而竞争对手无法限制我们的能力，那么 Meta 和许多其他公司就可以自由地为人们打造更好的服务。”

———————————————

雷递由媒体人雷建平创办，若转载请写明来源。