雷递网 乐天 7月25日
社交网络Meta日前宣布发布其大型语言模型的最新版本Llama 3.1,Meta声称该模型目前可与OpenAI和Anthropic等竞争对手相媲美。
新模型发布仅三个月前,Meta刚将Llama 3整合到Meta AI中。
Meta AI是一款聊天机器人,已在Facebook、Messenger、Instagram和WhatsApp 中使用,还为该公司的智能眼镜提供支持。在此期间,OpenAI 和 Anthropic 已发布各自 AI 模型的新版本,这表明硅谷的 AI 军备竞赛不会很快放缓。
Meta表示,新模型名为Llama 3.1 405B,是第一个可以在常识、数学技能和跨多种语言翻译方面与竞争对手竞争的公开模型。
Meta声称,该模型在16,000 多个 NVIDIA H100 GPU上进行训练,这是目前最快的芯片,每个芯片售价约为 25,000 美元,可以在 150 多个基准测试中击败竞争对手。
“405B”代表4050亿个参数,这些参数是AI模型用于推理和决策的内部变量。AI模型的参数数量越多,我们认为它就越聪明。相比之下,据报道OpenAI的GPT-4模型拥有大约1.5万亿个参数,尽管该公司尚未透露具体数字。此外,Meta还发布了现有Llama模型的升级版,分别包含700亿和80亿个参数,并声称新版本具有更强的推理能力等。
开发人员可以从其官方网站下载Llama 3.1,而普通用户可以通过WhatsApp中的Meta AI或该公司聊天机器人网站meta.ai使用它。
“Llama 405B改进的推理能力使Meta AI能够理解和回答你更复杂的问题,尤其是在数学和编码方面,”Meta的博客文章指出。 “您可以通过分步解释和反馈获得数学作业方面的帮助,通过调试支持和优化更快地编写代码。”
目前,Facebook、Messenger 和 Instagram 上的 Meta AI 仍然仅限于使用 700 亿个参数的较小版本的 Llama 3.1。
与 OpenAI、谷歌、微软和 Anthropic 将其 AI 模型保持专有不同,Meta 的 AI 模型是开源的,这意味着任何人都可以免费修改和使用它们,而无需与 Meta 共享个人数据。
Meta首席执行官马克·扎克伯格在一封信中表示,AI开发的开源方法将确保更广泛地获得该技术的好处,防止权力集中在少数大公司手中,并使整个社会更安全地部署 AI。
扎克伯格称,通过开源该公司迄今为止最大的语言模型,Meta 旨在让 Llama 成为任何人开发人工智能应用和服务的“行业标准”。
开源人工智能模型并将其添加到数十亿人使用的现有产品中,可以让 Meta更有效地与OpenAI竞争,OpenAI 的 ChatGPT 和 DALL-E 聊天机器人在 2022 年推出时引发了人工智能热潮。它还可以提高参与度——Meta 今天宣布,用户很快就能将人工智能生成的图像直接添加到 Facebook、Messenger、WhatsApp 和 Instagram上的提要、故事、评论和消息中。
扎克伯格在信中还批评了苹果及其封闭的生态系统,认为这家 iPhone 制造商的限制性和武断政策限制了 Meta 在其平台上构建的内容。
扎克伯格说:“很明显,如果我们能够打造出最好的产品,而竞争对手无法限制我们的能力,那么 Meta 和许多其他公司就可以自由地为人们打造更好的服务。”
———————————————
雷递由媒体人雷建平创办,若转载请写明来源。