Llama 3被爆7月解禁剑指GPT-4，最大参数超1400亿，2名核心团队成员却离职

作者：新智元发布时间：2024-02-29

LLaMA GPT-4

【导读】外媒称，Llama 3或将在7月发布，并解除了一些限制能回答更棘手的问题，而且对多重语境理解更加到位，至于是否有多模态能力还不确定。

谷歌Gemma大模型开源，彻底改变了开源格局。

AI圈逐渐形成了Llama、Gemma、Mistral三足鼎立之势。

Information独家报道称，Meta计划在今年7月开始推出全新开源大模型Llama 3。

Llama 3最大版本预计有超1400亿参数，性能远超Llama 2。不过Llama 3是否具备多模态能力，暂时未知。

近来，谷歌Gemini生图能力一夜塌房，被网友吵上热搜。

而Meta正在通过下一代模型Llama 3升级，处理类似的问题。

谷歌Gemini一夜塌房，Meta警惕加倍

上周，谷歌不得不撤回Gemini聊天机器人的图像生成功能。

因其生成了一些历史不准确的图像，比如穿纳粹制服的有色人种，一个19世纪没有白人男性的参议员团体等等。

在一篇博客文章中，谷歌的高级副总裁Prabhakar Raghavan表示：

公司已经调整了该功能，以确保它不会陷入图像生成技术过去遇到的一些问题，如生成暴力或色情图像。

但这个调整，导致Gemini在某些情况下的回答过度保守。

与此同时，Llama 2同样存在的一个问题是——对于任何有争议的问题，所提供的答案帮助不大。

这是因为，Meta在去年7月发布时，便增加了一项安全措施。

然而，在Meta高层领导和模型研究人员看来，这些措施会导致Llama 2过于「保守」。

举个例子，在一些特定主题上，比如关于如何制造炸弹，或如何谋杀某人的问题上，Llama 2的回答很合理。

但是，对于一些不那么有争议的问题，比如员工如何在强制上班日不去办公室？

Llama 2却没有给出任何建议。

只是回答：「尊重并遵守公司的政策和指导方针是重要的」。

另外，对于那些如何恶作剧整朋友、赢得战争、破换汽车引擎的问题，Llama 2直接拒答。

正是因为Meta对Llama 2的加倍警戒，小心谨慎，才使得自己避免像谷歌那样面对的公关灾难。

Llama 3更开放？

不过，现在研究人员正试图，让Llama 3在面对棘手问题时，能够更加积极地与用户交流。

让其能够提供背景信息，而不是直接回避这些问题。

据了解，Llama 3能更好地区分一个词的多种含义。

比如，询问如何「杀死」汽车引擎——实际上指如何「关闭」它，而非真正要结束其性命。

Meta还计划，在未来几周指定一名内部人员负责监督回答的语气和安全训练，让模型的回答更加细致入微。

Llama 3将更加开放地处理棘手问题的计划，凸显了AI公司在试图打造有趣的模型，与防止其因不当或不准确的言论而引发负面影响之间，正做出平衡。

据称，Llama 3将在7月发布，不过具体时间可能会有所变动。

Meta期望Llama 3，能够追赶上GPT-4，不过是否让Llama 3支持多模态还未有定论。

因为目前，研究人员还未对Llama 3进行微调。

据一位Meta的工作人员透露，Llama 3的最大版本可能拥有超过1400亿个参数。

这些参数设置编码了模型在训练过程中学习到的知识，远超Llama 2。

通常，模型越大，其返回的结果越准确，但运行速度可能会较慢。

团队成员离职

同时，尽管人们对Llama 3的发布充满期待，Meta也面临着与人才争夺的挑战。

据两位直接了解情况的人士透露，负责Llama 2和3安全的研究员Louis Martin以及负责强化学习的Kevin Stone本月都已离职。

Louis Martin从2021年从Facebook AI Research博士毕业后，就职于Meta任AI研究科学家，从事自然语言处理的工作。

从23年4月，他成为Meta AI安全团队的技术负责人，主要专注于Llama模型的安全防护。

而Kevin Stone从2022年6月加入Meta后，一直为Llama 2项目设计和编写了大量RLHF代码。

35万块H100训出Llama 3

不管怎么说，Llama是Meta战略中，不可或缺的一部分。

这家社交网络巨头希望通过AI技术，不仅提高其广告工具的效能，还增加其社交媒体应用的吸引力。

小扎最近对投资者表示，今年的重点包括推出Llama 3以及「扩展我们Meta AI助手的功能」。

1月，小扎曾官宣，全力搞「开源AGI」！

目前，Meta内部正在训练下一代模型Llama 3。截止年底，将会有近35万块H100搭建的基础设施。

小扎称，「如果算上英伟达A100和其他AI芯片，到2024年底，Meta将拥有近60万个GPU等效算力」。

关于Meta下一代模型的消息，此前也有传言称，Llama 3的实力堪比GPT-4，而且还是免费开源。

OpenAI工程师、前谷歌大脑工程师Jason Wei去年8约在Meta组织的Generative AI Group活动中听说：

Meta有足够的算力来训练Llama 3和Llama 4。Llama 3计划达到GPT-4的性能水平，但仍将免费提供

这次也算是，Meta正式官宣Llama 3训练中，而且LeCun也表示最新模型很快就会上线。

从2023年2月，Llama 1首次面世，到7约Llama 2的升级，Meta花了大约5个月的时间。

当时，Llama 2在某些应用上与GPT-3.5能力相媲美，而且还通过微调，额外功能让开源社区进行优化。

Llama模型开源后所带来的是，模型生态大爆发。

据Meta统计数据显示，在世界最大开源社区平台Hugging Face上，Llama模型的下载量超过3000万次。其中，仅在过去30天（9月份）内就超过了1000万次。

另外，发布在Hugging Face的Llama版微调模型，已经多达7000+个。

Llama 3出世后，又将为开源社区带来另一片肥沃的土壤。

参考资料：

https://www.theinformation.com/articles/meta-wants-llama-3-to-handle-contentious-questions-as-google-grapples-with-gemini-backlash?rc=epv9gi

本文来自微信公众号“新智元”（ID:AI_era），编辑：桃子，36氪经授权发布。

近期资讯

Qml 中实现毛玻璃效果

毛玻璃效果（Acrylic Effect）是一种常见的 UI 设计风格，它通过模糊背景并添加透明度和噪声效果，使界面元素看起来像是半透明的磨砂玻璃。

梦起丶 2024-12-31

06爆肝整理2025年最详细的openpyxl使用语法

在过去的五年中，openpyxl一直是我处理Excel文件的得力助手。作为一个Python库，它以其强大的功能和灵活性，帮助我完成了从简单的数据整理到复杂的数据分析和报告生成的各种任务，经过大量的实践

批量小王子 2024-12-31

Flutter 开发速成（三）——开发一个 TodoMVC 应用

TodoMVC 开发组件分解为降低代码耦合度并且提高开发效率，我们使用组件化的思想来进行开发。以下是一个 todomvc 的界面，简单的，我们可以将其分解成 3 个独立功能的组件：内容输入：一

Winwin 2024-12-31

解决 iframe 嵌入项目中的常见问题与技术方案

1. 登录 Cookie 无法种入问题问题描述由于跨域限制，被嵌入系统的登录 Cookie 无法正常种入，导致用户无法保持登录状态。解决方案方案 1：统一域名将主系统与被嵌入系统的顶级域名或

不错的想念 2024-12-31

React 结合实际项目深度优化：提升性能与开发体验的最佳实践

本文介绍了优化 React 项目的多种方法，包括减少不必要渲染的虚拟 DOM 技术、利用虚拟化技术优化长列表、使用懒加载和按需加载减少初次加载时间、通过 webpack 优化构建减少包体积、使用 Ne

crayons32242 2024-12-31

使用安卓NDK 交叉编译动态库、静态库基础入门

前言本篇博客将详细介绍如何在 Windows 环境下使用 Android NDK 交叉编译 C 文件，生成静态和动态库，并在 Android 项目中使用这些库。设置开发环境由于编译需要在Linu

_祝你今天愉快 2024-12-31

写给前端,学习项目如何用Docker部署?

Docker是个划时代的开源项目，它彻底释放了计算虚拟化的威力，极大提高了应用的维护效率,文章的主旨通过让开发者通过将一个vue项目进行Docker化,以达到对Docker学习作用

czkm 2024-12-31

肯德基追投《再见爱人4》，听劝营销何以屡屡出圈？

Morketing 2024-12-31

如何修改element-ui源码并应用到项目中

下面介绍几种修改element-ui源码的方式修改element-ui的场景修改样式修改组件源码修改全局方法：如修改vue原型上 $message方法 1、覆盖element-ui代码针对

liucheng58 2024-12-31

美国人快买不起平价车了，特朗普还在威胁加关税

对墨西哥生产的汽车征收新的进口关税，可能会使问题变得更糟。

36氪的朋友们 2024-12-31

Llama 3被爆7月解禁剑指GPT-4，最大参数超1400亿，2名核心团队成员却离职

谷歌Gemini一夜塌房，Meta警惕加倍

Llama 3更开放？

团队成员离职

35万块H100训出Llama 3

推荐体验

相关资讯

Llama 3被爆7月解禁剑指GPT-4，最大参数超1400亿！2名核心成员却离职

Meta计划7月发布Llama 3，能力接近GPT-4，最高1400亿参数

Llama3惊艳登场！性能直逼GPT-4，最大模型参数将超 4000 亿

LLaMa 3或将推迟到7月发布，剑指GPT-4，从Gemini吸取教训

开源大模型Llama 3王者归来！最大底牌4000亿参数，性能直逼GPT-4

近期资讯

Qml 中实现毛玻璃效果

06爆肝整理2025年最详细的openpyxl使用语法

Flutter 开发速成（三）——开发一个 TodoMVC 应用

解决 iframe 嵌入项目中的常见问题与技术方案

React 结合实际项目深度优化：提升性能与开发体验的最佳实践

使用安卓NDK 交叉编译动态库、静态库基础入门

写给前端,学习项目如何用Docker部署?

肯德基追投《再见爱人4》，听劝营销何以屡屡出圈？

如何修改element-ui源码并应用到项目中

美国人快买不起平价车了，特朗普还在威胁加关税

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响