ChatGPT只算L1阶段，谷歌提出AGI完整路线图

作者：量子位发布时间：2023-11-08

ChatGPT DALL·E 谷歌 AGI

AGI应该如何发展、最终呈什么样子？

现在，业内第一个标准率先发布：

AGI分级框架，来自谷歌DeepMind。

该框架认为，发展AGI必须遵循6个基本原则：

关注能力，而非过程
同时衡量技能水平和通用性
专注于认知和元认知任务
关注最高潜力，而非实际落地水平
注重生态有效性
关注整条AGI之路的发展，而非单一的终点

在此原则之上，AGI将呈现6大发展阶段，每个阶段都有对应的深度（性能）和广度（通用性）指标。

我们当前的AI产品走到哪一阶段了？这里也有答案。

详细来看。

6项基本原则

什么是AGI？

对于这个问题，许多科学家、研究机构都给出了自己的理解。

比如图灵提出的图灵测试认为机器是否能“思考”就是一个衡量指标；强人工智能的概念提出者则认为，AGI是一个拥有意识的系统；还有人说AGI一定是能在复杂性和速度上与人脑一样甚至超越人脑……

谷歌认为，这些定义都不全面。

像图灵测试，一些LLM已经可以通过，但我们能称那些模型为AGI吗？

像类人脑说法，Transformer架构的成功就已表明，严格基于大脑的思考过程对于AGI来说并不是必须的。

通过分析这些定义（一共9种，详情可翻阅原文）的优缺点，谷歌重新理出了6项基本原则：

一、关注能力，而非过程。

这可以帮助我们去除一些不一定是实现AGI的必备要求：

比如AGI不一定要用类似人类的方式思考或理解，也不意味着系统必须具有主观意识等能力（主要是这种能力无法也通过固定的方法去测量）。

二、注重通用性和技能水平。

目前所有的AGI定义都强调了通用性，这一点不必多说。但谷歌强调，性能也是AGI的关键组成部分（也就是可以达到人类的几分水平）。在后面的具体阶段制定中，主要也是根据这俩指标进行分类的。

三、专注于认知和元认知任务。

前者目前基本为共识，即AGI可以执行各种非体力任务。不过谷歌在此强调，AI系统执行物理任务的能力也需要加强，因为它对于认知能力是有推动作用的。

此外，元认知能力，如学习新任务或知道何时向人类寻求帮助，是系统走向通用性的关键先决条件。

四、关注最高潜力，而非实际落地水平

证明一个系统可以在给定的标准上完成任务，就足以宣布该系统为AGI，我们不要求一定得在开放世界中完全部署出水平相同的系统。

因为，这可能会面临一些非技术阻碍，比如法律和社会考虑、潜在道德问题。

五、注重生态有效性。

所谓生态有效性，谷歌指的是选择真正有用的现实任务去benchmark系统的进步，这些任务不仅包括经济价值也包括社会和艺术价值，要避开那些容易自动匹配和量化的传统AI指标。

六、关注整条AGI之路的发展，而非单一的终点。

这也是为什么谷歌要制定我们接下来将要看到的6个发展阶段。

6大必经阶段

AGI之路的6个阶段由深度指标（即技能水平，与人类相比）和广度指标（通用性）进行划分。

第零阶段为“No AI”，计算软件、编译器等属于该范畴，在通用性上只能执行human-in-the-loop任务。

第一阶段为“涌现级”（Emerging），技能相当于或略比没有相关技能的人类要强。

ChatGPT、Bard和Llama 2等大模型就属于该阶段，并且已经满足了该阶段要达到的通用性。

第二阶段可理解为“刚刚合格级”（Competent），可以达到正常成年人50%的水平。

像语音助手Sir、能在短文写作/简单编码等任务中达到SOTA水平的大模型都属于这一阶段。

不过，它们都只是在技能指标上合格了，通用性还够不上，也没有其它能够达到这一阶段通用性水平的AI产品。

第三阶段为“专家级”（Expert），可达到正常成年人90%的水平。

谷歌认为，拼写和语法检查器如Grammarly、图像生成模型Imagen等可以划为该阶段，主要也是在技能水平上达标了，通用性还不够。

第四阶段为“大师级”（Virtuoso），可达到正常人类99%的水平。

深蓝、AlphaGo等都属于。同样，还没有哪个AI产品可以达到属于这一级别的通用能力。

最后一阶段为“超人级”（Superhuman），在技能指标上，已经可以超越顶尖科学家的AlphaFold、AlphaZero也可划入该阶段。

毫无疑问，具备超人智能级通用性的AI还没诞生。

从中我们看出，按照谷歌这个标准来看，大多数已有AI产品其实都分别进入了不同的AGI阶段，但只仅限于在技能水平上——要谈及通用性，目前只有ChatGPT等模型完全合格。

但它们也只还处于最底层的“一级AGI”阶段。

不过，正如原则2所说，评价AGI就是要看这技能水平和通用性这两个指标，这样划分也算说得过去。

值得一提的是，我们可以看到，像DALLE-2这样的图像生成模型已经可以归类于“三级AGI”。

谷歌给出的理由是，因为它生成的图像已经比大多数人都要强了（也就是超越90%人类）。

这一划分并未考虑大多数用户由于提示技巧不佳，无法达成最佳性能的情况。

因为遵循原则4，我们只需要关注一个系统的潜力到了就够了。

另外，对于最终阶段的AGI，谷歌畅想，它除了蛋白质结构预测，还可能能同时进行与动物交流、分析大脑信号、进行高质量预测等各种人类难以企及的任务，这样才不枉费我们的期待。

最后，对于这个层级划分，谷歌也承认还有很多事情要做：

比如在通用性维度上，应该用哪些标准任务集进行测量？完成多大比例的任务才行？有哪些任务是一定要满足的？

这些问题一时都不大可能全部摸清。

你同意谷歌提出的这些原则和阶段划分吗？

原文： https://arxiv.org/abs/2311.02462

本文来自微信公众号“量子位”（ID:QbitAI），作者：丰色，36氪经授权发布。

近期资讯

《守望先锋》国服官网上线：代码曝光回归时间！

快科技12月31日消息，没想到，2024年最后一天，《守望先锋》国服官网正式上线，目前可以正常使用国服战网账号登陆。官网首页为“好久不见，欢迎回家”的标语，下方则是英雄的介绍。

拾柒 2024-12-31

《GTA6》B站预告对比油管女人汗毛妊娠纹细节清晰

近日，国内视频平台哔哩哔哩突然引发了大量海外玩家的关注，其背后的原因是由于一位海外推主发现《GTA6》首支预告在B站的版本要比外国人常用的YouTube版本清晰不少，其中展现的细节也更加丰富。

2024-12-31

4万多人在线看肥娟一块一块数钱：营业额再创新高

12月31日消息，据媒体报道，此前有一家暖心鞋店引发全网关注，店主夫妇因“收留”了不少下课来看电视的孩子们受到关注。店老板介绍，童鞋店开在一家小学附近，每天放学后都会有很多

振亭 2024-12-31

创维新款23.8寸显示器上市：2K 180Hz屏仅899元

快科技12月31日消息，创维推出了23.8寸显示器——F24G52Q Pro，首发899元。新款显示器采用23.8寸的Fat IPS面板，2560x1440分辨率、180Hz刷新率、400nits峰值亮度。同时，该显示

鹿角 2024-12-31

我国开建全球最大万吨级纯电动运输船：续航可达500公里

快科技12月31日消息，据央视新闻报道，日前，全球最大的万吨级纯电动运输船在湖北宜昌开工建设。该船是三峡集团所属长江电力三峡电能牵头、国内多家科研单位参与的重点项目，是我国万吨级

若风 2024-12-31

知名投资人：英伟达正在“印钱” AI机遇无穷无尽！

“AI总龙头”英伟达的股价确实在年末这段时间遭受了一些挫折，但站在2024年的最后一天展望未来，专家和投资者相信，这家人工智能（AI）市场的宠儿即将迎来新的篇章，以及更令人印象深

2024-12-31

泪奔！韩国客机失事最惨一幕：1家9口空难离世家仅剩狗

12月31日消息，当地时间12月29日，一架韩国济州航空7C2216航班的客机在位于韩国全罗南道的务安机场着陆时，偏离跑道后撞上机场围墙。除2人获救外，机上其余179人全部遇难，这是在韩国国内发生

雪花 2024-12-31

马斯克评论文章激怒德国：炮轰世界首富干预大选

财联社12月31日讯（编辑史正丞）就在距离德国大选还剩8周之际，世界首富、美国当选总统特朗普的亲密顾问、特斯拉CEO马斯克又成了德国政府的炮轰对象。当地时间周一，德国政府的副新闻发言人C

2024-12-31

Windows本地AI开发神器！微软推出并开源AI Dev Gallery

快科技12月31日消息，微软针对Windows 11 AI+ PC设备推出了一项名为AI Dev Gallery的新功能，旨在帮助开发者在其应用中融入端侧AI功能。该功能已在GitHub上开源，为开发者提供了一个强大的本地

黑白 2024-12-31

我国新规：司机驾年龄延长至63岁摩托车放宽至70岁！

快科技12月31日消息，据国内媒体报道称，新修订的《机动车驾驶证申领和使用规定》明天开始（2025年1月1日）实施。新规中显示，大中型客货车驾驶证的申请年龄上限由60周岁延长至63周岁，大中型

雪花 2024-12-31

ChatGPT只算L1阶段，谷歌提出AGI完整路线图

6项基本原则

6大必经阶段

推荐体验

相关资讯