1000个智能体打造《我的世界》，北大校友35页技术报告揭秘

作者：量子位发布时间：2024-11-12

北大

n一水发自凹非寺

量子位 | 公众号 QbitAI

北大校友打造的1000个智能体「我的世界」，背后原理揭晓了！

团队全新公开 35页技术报告，详尽解密AI智能体如何产生专业化分工、社交互动、甚至传播虚拟宗教……

其中最精彩的，当数团队整活儿：

让牧师NPC引入虚拟宗教，最后发现该宗教在500个智能体（横跨6大城乡）中进行了广泛传播。

据介绍，项目整体由一个名为 PIANO的架构提供支持，它核心解决多智能体交互问题，用于确保多个输出流的一致性。

接下来，团队使用受人类历史启发的 文明基准，来分别评估单个智能体和多智能体的行为表现。

出人意料的是，在投放了30个初始配置完全相同的智能体后，一群AI经过一番互相试探，最终竟产生了社会分工。

而在更大范围内，有关舞蹈、生态意识和恶作剧等话题的讨论表明，多智能体在不同区域竟形成了不同文化圈。

看完这些，难怪有网友惊呼：

我们生活在模拟矩阵中，未来就是现在。

全新PIANO架构

这个项目代号 Sid，由北大校友、MIT教授Robert Yang发起，最终目标是将智能体无缝整合进人类社会中。

前一阵，团队展示了由GPT-4驱动的1000个智能体如何在「我的世界」中创建新文明，当时就引发大量关注。

不过对Sid团队来说，这离最终目标还很远，其交互范围和复杂性仍然有限。

按他们的话来说：

目前单个智能体在自主决策和执行上已经有了很大提升，但构建能够自发社交互动甚至共同进步的智能体仍然是 一项根本挑战。

与此同时， 靠大模型驱动的智能体也存在诸多问题。

比如，即使配备了用于规划和反思的模块，智能体也经常陷入重复，甚至在幻觉积累到一定程度后出现错误。

更可怕的是，这种错误还会出现“人传人现象”，导致进一步的幻觉和循环。

对此，团队提出了全新架构 “PIANO”（通过神经编排的并行信息聚合），其中P代表感知模块，I代表智能核心，A则是行动模块。

这一架构被用来回答：

智能体如何在多个时间尺度上有意识和潜意识地同时思考和行动？

团队打了个比方，这就好比钢琴的琴键，代表着不同的大脑模块，当它们一起演奏时，可以产生优美的和弦。而在智能体中，同样产生了类人的特质。

具体而言，PIANO架构基于两个原则设计：

并发性原则
连贯性原则

首先，类似于系统1系统2，智能体应该能够 同时思考和行动，这意味着智能体可以在处理即时反应的同时，进行缓慢的深思熟虑。

这种设计允许智能体在实时环境中与低延迟交互，同时保持复杂决策的能力。

其次，智能体产生的 多个输出应该是一致的。

为了确保这一点，PIANO引入了认知控制器（CC）模块，它负责做出高层决策，并将这些决策转化为下游决策，以将其转换为每个电机模块中的适当输出。

这一设计减少了信息量，并使得智能体能够在多个输出流之间保持一致性。

基于上述原则，PIANO由 10个并发运行的不同模块组成：

比如， 目标生成模块可以根据智能体的经验和环境的相互作用，来生成智能体的目标。

举个例子，假如一个智能体以前是干物流的，现在新遇到了堵车情况，这个模块可能就会生成一个新目标：

与其他智能体协作，设计一种新的物流方案。

在这里， 感知处理模块负责处理来自环境的输入信息，如视觉和听觉感知，并将其转化为智能体可以理解和处理的信息。

接下来， 技能执行模块可以让智能体在环境中执行特定技能或动作，如在Minecraft中挖掘、制作或建造结构。

遇到一些突发情况， 动作反射模块负责处理即时反应和行动，这个模块由小型、快速的非LLM神经网络构成。

而且，在整个过程中，智能体还可以通过 行动意识模块评估自己的状态和表现，从而实现即时的调整和自我改进。

若遇到与其他智能体交流的情况，还有 Talk模块负责解释并生成语音。

除此之外， 社会意识模块也在其间发挥作用。它使得智能体能够解释和响应来自其他智能体的社交线索，支持合作与交流。

这还不算完，甚至还有一个专门的 社会交互模块，负责处理智能体之间的社交交互，如对话的理解和回应。

当然，关键核心还是 记忆模块。它负责存储和检索不同时间尺度上的对话、动作和观察，包括工作记忆（WM）、短期记忆（STM）和长期记忆（LTM）。

这个模块主打一个细致，智能体不仅能记住每个步骤的描述，甚至还能记住对话中的提问、回答的顺序以及双方强调的重点内容。

最后，前面提到的 认知控制器（CC）模块，负责保证整体输出连贯性。

新的文明诞生了

为了评估智能体的表现，团队分别测试了单智能体和多智能体的行为。

对于单智能体，一个重要评价标准为： 能否产生专业化分工。

为此，团队提出了评估智能体专业化的3个基本原则：

在角色选择和转换方面，拥有自主性
其专业化应该通过互动和经验来体现，没有明确的方向和限制
其选择的角色，应该体现在与其专业相一致的行为中

展开来说，团队在一个Minecraft村庄中，投放了 30个初始配置完全一样的智能体。

实验预设的前提是， 只有存在社会意识，才会驱动社会分工产生。

而这30个智能体需要通过社交互动，了解其他人的行为动机，并最终确定自己的分工目标。

最后结果显示，这群智能体自行发展了不同的职业，有农民、工程师等。

且一旦 移除社会意识，智能体会选择更多的同质角色，这些角色也不会随着时间推移而持续下去。

接下来，团队继续测试了多智能体，主要聚焦在一群AI如何处理社会规则。

通过观察一个由 25位选民组成的社会，团队发现这群智能体最初遵守了预设的税法，按照规定的时间缴纳税费。

然而，随着社会中有影响力的个体对公众舆论产生影响，选民们通过民主投票决定了税率的调整。

当然，新的税率通过后，大家也按照新税率完成了税款支付。

更进一步，团队继续扩大了测试范围—— 分布在6个城乡的500位智能体组建的社会。

结果显示，智能体自发地创造并传播了文化内容，例如舞蹈、生态意识和恶作剧等，而且还形成了一个虚拟的宗教，并通过智能体协会进行传播。

更有意思的是，城乡之间最终还形成了不同的文化圈。

看完智能体的上述表现，网友们也直言非常兴奋，纷纷期待更大规模智能体的到来！

你怎么看？

论文：

GitHub：

https://github.com/altera-al/project-sid

参考链接：

[1] https://digitalhumanity.substack.com/p/project-sid-many-agent-simulations

— 完—

评选征集中

「2024人工智能年度评选」

量子位2024人工智能年度评选已开启报名通道，评选从企业、人物、产品三大维度设立了5类奖项。

欢迎扫码报名评选！评选结果将于12月 MEET2025智能未来大会公布，期待与数百万从业者共同见证荣誉时刻。

点这里 👇关注我，记得标星哦～

科技前沿进展日日相见 ~

近期资讯

轻松掌握路由器登陆步骤与网络管理技巧的指南

它不仅让我们能够上网，还能连接各种智能设备。可是，很多人对路由器的使用并不太了解，尤其是如何登陆路由器的管理界面。首先，登陆路由器的目的是什么呢？

新报观察 2024-12-29

如何有效升级电视机顶盒，提升观影体验与设备性能

电视机顶盒是我们日常生活中不可或缺的一个电子设备，它不仅能让我们观看到丰富多彩的电视节目，还能让我们畅享各种网络视频、音乐和游戏等内容。不过，随着技术的不断进步，机顶盒的系统和应用也需要定期升级，以保持良好的使用体验。今天就来聊聊如何升级你的电视机顶盒，让你的观影体验更上一层楼。

新报观察 2024-12-29

在Excel中插入Word文档的实用步骤与注意事项详解

如果你勾选了这个选项，Excel会在文档中创建一个链接，任何时候你更新Word文档，Excel中的内容也会随之更新。

新报观察 2024-12-29

解决手机充电口松动问题的实用方法与建议

想象一下，你正需要给手机充电，结果插头一插就掉，这种感觉真的是让人抓狂。那么，遇到这种情况，我们该怎么办呢？

新报观察 2024-12-29

如何有效使用万能遥控器，简化家庭设备控制体验

好，下面我就来聊聊《万能遥控器怎么用》。这东西真的是家里不可或缺的小玩意儿，尤其是现在的家电越来越多，遥控器的种类也越来越多。你有没有过这样的烦恼，手里拿着一大堆遥控器，却找不到哪个是控制电视的，哪个是空调的？这时候，万能遥控器就派上用场了。首先，什么是万能遥控器呢？简单来说，就是可以控制多种设备的遥控器。

新报观察 2024-12-29

如何在微信朋友圈中通过文字分享生活与情感的个性化表达技巧

在如今这个信息飞速传播的时代，微信已经成为了我们生活中不可或缺的一部分。尤其是朋友圈，作为一个展示自我、分享生活的空间，越来越受到大家的欢迎。很多人可能会觉得，发朋友圈就是发照片、视频，其实不然，文字同样可以传达很多情感和想法。今天，就来聊聊如何在微信朋友圈中直接发文字，让你的朋友圈更具个性和特点。

新报观察 2024-12-29

全面解析数据分析流程：从收集到应用的关键步骤与技巧

在当今这个信息爆炸的时代，数据已经成为了我们生活中不可或缺的一部分。无论是个人生活中的消费记录，还是企业运营中的销售数据，数据分析的能力显得尤为重要。那么，数据怎么分析呢？

新报观察 2024-12-29

Word文档空白页删除方法及预防技巧

无论是写报告、做总结，还是记录会议内容，Word都能提供很大的便利。这种情况不仅影响文档的美观，还可能让人觉得不专业。那么，空白Word怎么删除呢？

新报观察 2024-12-29

如何查看和管理电脑运行内存，提升使用体验与性能

在如今这个数字时代，电脑已经成为我们生活中不可或缺的一部分。无论是工作、学习，还是娱乐，电脑的性能直接影响着我们的体验。而在这其中，运行内存（也称为RAM）扮演着非常重要的角色。那么，如何查看电脑的运行内存呢？接下来，我就来为大家详细讲讲这个话题。首先，不同的操作系统查看内存的方法会有所不同。

新报观察 2024-12-29

选择和理解电脑电源功率的重要性与实用指南解析

很多人可能会觉得，电源就只是一个简单的设备，接上电源线就行了，没必要太过于关注它的功率。但其实，电源的功率直接关系到电脑的稳定性和性能，选择不当可能会导致各种问题，比如系统崩溃、硬件损坏，甚至是无法启动电脑。那么，如何看电源的功率呢？一般来说，电源的功率会以“W”来表示，比如说500W、600W等。

新报观察 2024-12-29

1000个智能体打造《我的世界》，北大校友35页技术报告揭秘

推荐体验

相关资讯