OpenAI联合创始人Andrej Karpathy：谈谈AGI，以自动驾驶为例

作者：学术头条发布时间：2024-03-28

【编者按】ChatGPT、GPT-4 的出现，让人们真真正正感受到「大模型改变世界」的强大能力。然而，关于大模型的讨论大多是抽象的、不具体的，或许过于乐观，或许过于忧虑。

正如 OpenAI 联合创始人、前特斯拉人工智能和视觉总监 Andrej Karpathy 在题为“Self-driving as a case study for AGI”的最新博客中写到的：“不幸的是，很多讨论都相当抽象，导致人们在这个话题上绕圈子，无法达成共识。”

Karpathy 以自动驾驶为例，谈到了个人对 AGI 未来形态的看法，认为“自动驾驶能力方面的发展是研究 AGI 的一个很好的早期案例研究”。

核心观点如下：

Copilot 和 GPT-4 就是“二级”编程自动化；
AGI 会受到“需求超过供应”的限制，原因在于，开发者的自我限制、监管限制，以及简单直接的资源短缺（如需要建设更多的 GPU 数据中心）；
在更广泛的工作领域中，许多工作将发生变化，一些工作会消失，但也会出现许多新的工作机会，这更多的是工作的重构而不是直接删除；
AGI 更像是自动驾驶这样的技术，它的进展是逐步的，社会既是观察者也是参与者，其扩展受到多种因素的限制，包括监管和受过教育的劳动力资源、信息、材料和能源；
世界不会因此崩溃，而是会适应、改变和重构。以自动驾驶为例，交通的自动化将使其更加安全，城市将变得更加清洁、通畅，停车场和路边停放的汽车将逐渐消失，为人们腾出更多空间。

学术头条在不改变原文大意的情况下，做了简单的编译。内容如下：

近期，随着大型语言模型（LLMs）的发展，围绕着通用人工智能（AGI）、其发展时间表以及可能的形态等话题，社会上出现了许多讨论。这些讨论有的充满希望和乐观，但也不乏对未来的忧虑和悲观。不幸的是，很多讨论都相当抽象，导致人们在这个话题上绕圈子，无法达成共识。因此，我一直在寻找具体的类比和历史先例，从而以更实际的方式探讨这个话题。特别是当被问及我个人对 AGI 未来形态的看法时，我倾向于以自动驾驶为例进行说明。在这篇文章中，我将解释这一点。

首先，让我们看看 AGI 的一个常见定义：

AGI：一种可以在大多数有经济价值的工作中超越人类能力的自主系统。

请注意，这个定义中有两个具体要求。首先，它是一个完全自主的系统，即它能够在极少或没有人类监督的情况下独立运作；其次，它能够在大多数有经济价值的工作中自主操作。为了具体说明，我个人喜欢参考美国劳工统计局的职业指数。同时具备这两种特性的系统，就是 AGI。

在这篇文章中，我想提出的观点是，我们最近在自动驾驶能力方面的发展是一个很好的早期案例研究，可以说明自动化程度不断提高所带来的社会动力，进而说明 AGI 总体上会是什么样子。

我之所以这样认为，是因为自动驾驶领域有一些特点，大致可以概括为“这是一件大事”：自动驾驶对社会来说非常直观和可见（想象一下街道上没有司机的汽车！），从规模上看，它是经济的一大组成部分，目前雇佣了大量的人力工作（想想 Uber/Lyft 的司机），而且驾驶是一个难以自动化的问题，但我们做到了（领先于经济的许多其他领域），社会已经注意到并正在对此做出反应。当然，还有其他行业也经历了巨大的自动化变革，但我个人对它们不太熟悉，或者它们在上述某些特点上有所不足。

部分自动化

在人工智能领域，自动驾驶被认为是一个“足够复杂”的问题，它不是凭空出现的；它是一个将驾驶任务自动化的渐进过程，中间有许多“工具人工智能”的结果。

在汽车自动驾驶方面，许多汽车现在都配备了“二级”驾驶辅助系统——一种与人类协作，共同完成从 A 点到 B 点行驶任务的人工智能。这种系统并非完全自动化，但可以处理很多低级别的驾驶细节。有时，它甚至能自动完成整个操作（比如，为你停车）。人类主要作为这一活动的监督者，但原则上随时可以接管驾驶任务，或下达高层次指令（比如，请求换道）。在某些情况下（比如，跟随车道和快速决策），人工智能的表现超过了人类，但在罕见的场景中仍然可能不如人类。这与我们开始在其他行业部署的许多工具型人工智能类似，尤其是随着大型语言模型的能力不断提升。例如，作为一名程序员，当我使用 GitHub Copilot 自动完成一段代码，或用 GPT-4 编写更大的 function 时，我将低级细节交给了自动化系统，但同时，我也可以在需要时进行“干预”。也就是说，Copilot 和 GPT-4 就是“二级”编程自动化。在整个行业中有许多此类二级自动化，它们并非都基于 LLMs——从 TurboTax 到亚马逊仓库里的机器人，再到翻译、写作、艺术、法律、市场等领域的许多其他“工具型人工智能”。

全自动化

在自动化技术的发展中，有些系统达到了足够的可靠性，变得像今天的 Waymo 一样。它们逐渐进入了完全自主的领域。如今在旧金山，你可以打开一个应用程序，呼叫 Waymo 而不是 Uber。一辆无人驾驶的汽车就会来接你，把你这位付费乘客带到目的地。这真的很惊人。你不需要懂得开车，也不必保持注意力集中，你可以放松地躺下小睡一会，而系统会安全地把你从 A 点送到 B 点。和我交谈过的许多人一样，我个人更喜欢乘坐 Waymo 而不是 Uber，并且几乎完全转用 Waymo 来进行市内交通。你会得到一个更加稳定、可重复的体验，驾驶很平稳，可以播放音乐，还可以和朋友聊天，而不用花费脑力去思考司机在听你说话时在想什么。

全自动化的混合经济

然而，即使现在已经有了自动驾驶技术，但仍有许多人选择叫 Uber 而不是 Waymo。原因是什么？首先，许多人根本不知道他们可以叫 Waymo。即便知道，他们也可能还不完全信任自动化系统，更愿意由人类驾驶。此外，有些人可能就是喜欢与人类司机交谈、开玩笑，享受与他人的互动。除了个人偏好外，从目前应用程序中等待时间不断增加的情况来看，Waymo 明显供不应求。没有足够的汽车来满足需求。这部分原因可能是 Waymo 正在谨慎管理和监控风险及公众舆论。另一个可能的原因是，Waymo 有一个来自监管机构的配额，即他们被允许在街道上部署多少辆车。此外，Waymo 也不能一夜之间就完全取代 Uber。他们需要建设基础设施、生产车辆、扩大运营规模。我认为，其他经济领域的各种自动化也会呈现类似的情况——有些人或公司会立即使用它们，但许多人 1) 对它们一无所知，2) 即使知道，也不信任它们，3) 即使信任，仍然更愿意雇佣和与人类合作。除此之外，需求超过供应，而 AGI 在这些方面也会受到相同的限制，原因也完全一样——开发者的自我限制、监管限制，以及简单直接的资源短缺（如需要建设更多的 GPU 数据中心）。

全自动化的全球化

正如我前面提到的资源限制，在全世界范围内推广这项技术仍然非常昂贵、劳力密集，且进展缓慢。如今，Waymo 只能在旧金山和凤凰城运行，但其方法本质上是通用且可扩展的，因此可能很快就会扩展到洛杉矶、奥斯汀等地。产品的推广也可能受到其他环境因素的限制，比如在大雪中行驶。在一些罕见的情况下，可能甚至需要人类操作员的救援。能力的扩展并非“免费”的。例如，Waymo 要进入一个新城市，就必须耗费资源。他们必须确定地位，绘制街道地图，调整感知和规划/控制系统，从而适应一些独特情况，或当地的规则和法规。在我们的工作类比中，许多工作可能只在某些环境或条件下实现完全自动化，而扩大覆盖范围需要工作和努力。在这两种情况下，方法本身是通用且可扩展的，前沿也会扩展，但只能随着时间的推移逐步实现。

社会反应

另一个让我觉得有趣的方面是，就在几年前，到处都是关于“它会成功吗”“它不会成功吗”的评论和 FUD（恐惧、不确定和犹豫），人们还在争论它是否可能。而现在，自动驾驶真的出现了，它不再是研究原型，而是一种产品——我可以用金钱换取全自动交通服务。在目前的运行范围内，该行业已实现了完全自主。然而，总的来说，几乎没人关心这一点。我交谈的大多数人（即使是科技行业的人！）甚至都不知道这一变化。当你乘坐 Waymo 在旧金山街头行驶时，你会看到许多人将其视为一种奇特的东西。他们先是惊讶，然后一直盯着看，然后继续他们的生活。当全自动化在其他行业引入时，也许世界并不会因此掀起风暴。大多数人可能一开始甚至都没有意识到这一点。当他们意识到时，可能会瞥一眼然后耸耸肩，这种反应从否认到接受不等。一些人对此则感到非常不安，在 Waymo 前放置锥形物进行抗议。当然，这方面的影响还远未完全显现，但当它发生时，我预计这将是一个广泛的预示。

经济影响

让我们来谈谈自动化对工作的影响。显然，Waymo 代替了司机的职位，但它也创造了许多之前不存在且不太显眼的工作——如协助收集神经网络训练数据的人工标注员、在车辆遇到问题时远程连接支援的客服人员、建造和维护车队、地图等的工作人员。为了组装这些高度智能化的高科技汽车，首先要创建一个由各种传感器和相关基础设施组成的全新产业。同样的，在更广泛的工作领域中，许多工作将发生变化，一些工作会消失，但也会出现许多新的工作机会。这更多的是工作的重构而不是直接删除，即使这种删除是最显著的部分。很难说总体的工作数量不会在某个时点和随时间而减少，但这种情况的发生速度要比天真地看待这种情况的人想象的慢得多。

竞争格局

我想考虑的最后一个方面是竞争格局。几年前，自动驾驶汽车公司数量众多。然而，由于这个领域的难度极大（我认为在当前的人工智能和计算技术水平下，实现自动化“仅仅是可能的”），如今，这个生态系统已经显著整合。Waymo 已经实现了自动驾驶未来的第一个功能完备展示。尽管如此，还有一些公司在追赶，包括 Cruise、Zoox，当然还有我个人最喜欢的 Tesla。鉴于我在这个领域的实际经历和参与情况，我在这里简要说明一下。我认为，自动驾驶行业的最终目标是在全球范围内实现完全自动驾驶。Waymo 采取的策略是首先实现自主性，然后在全球范围内扩展，而 Tesla 则是首先在全球范围内推广，然后逐步实现自主性。如今，我是这两家公司产品的忠实用户，就我个人而言，我更支持整体技术。然而，这两家公司中，一家还有大量的软件工作要做，另一家则有大量的硬件工作要做。我对哪一家发展得更快有自己的判断。话虽如此，正如许多其他经济领域可能经历的那样，经历了一段快速增长和扩张的时期（想想大约 2015 年的自动驾驶时代），但如果这个类比成立的话，最终只会有少数几家公司在激烈竞争中脱颖而出。在这一切中，将会有许多活跃使用的工具型人工智能（比如今天的二级 ADAS 功能），甚至一些开放平台（比如 Comma）。

通用人工智能

以上，就是我认为的 AGI 的大致轮廓。现在，只需在脑海中将其复制粘贴到整个经济中，以不同的速度发生，并产生各种难以预测的相互作用和二阶效应。虽然这个模型可能无法做到完美无缺，但我相信它是一个有用的思考工具。从某种角度来看，它不像一个自我递归改进的超级智能体，能够逃脱我们的控制，进入网络空间制造致命的病原体或纳米机器人，把整个银河系变成灰色的粘稠物。相反，它更像是自动驾驶这样的技术，它的进展是逐步的，社会既是观察者也是参与者，其扩展受到多种因素的限制，包括监管和受过教育的劳动力资源、信息、材料和能源。世界不会因此崩溃，而是会适应、改变和重构。以自动驾驶为例，交通的自动化将使其更加安全，城市将变得更加清洁、通畅，停车场和路边停放的汽车将逐渐消失，为人们腾出更多空间。我个人非常期待 AGI 在各个领域所带来的类似变革。

原文链接：

https://karpathy.github.io/2024/01/21/selfdriving-agi

OpenAI联合创始人Andrej Karpathy：谈谈AGI，以自动驾驶为例

部分自动化

全自动化

全自动化的混合经济

全自动化的全球化

社会反应

经济影响

竞争格局

通用人工智能

推荐体验

相关资讯

OpenAI联合创始人Andrej Karpathy：谈谈AGI，以自动驾驶为例

OpenAI联合创始人Andrej Karpathy：以自动驾驶为例，谈谈AGI

OpenAI联合创始人：谈谈AGI，以自动驾驶为例

OpenAI 联合创始人 Karpathy 发文：用自动驾驶诠释通用人工智能 AGI

OpenAI联合创始人Andrej Karpathy创立AI教育公司Eureka Labs

近期资讯

如何轻松关闭或卸载360软件的详细步骤与技巧

中国科学家发现准粒子禁闭与非禁闭的开关密码

首个科学计算基座大模型 BBT-Neutron 开源，突破大科学装置数据分析瓶颈

全球最大，顺利投产！

入局具身智能利亚德虚拟动点用空间计算补齐机器人能力拼图

理想汽车会做人形机器人吗？李想：100%会做，但不是现在

浙江建德往返安徽黄山航线时隔三年复航

美的集团获得实用新型专利授权：“水阀、饮水机和冰箱”

国补800元钜惠：TCL G120T7H-HDIS洗烘一体机，全能洗衣管家

“千帆思享会”：百度智能云发布交通大模型SaaS系列，包括信控、智能问答、道路隐患排查平台

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响