1000个智能体创建首个「AI文明」，北大校友放弃MIT教职打造「西部世界」

作者：新智元发布时间：2024-09-04

北大

【导读】在我的世界里，出现了有史以来第一个智能体文明。1000多个智能体一同协作，在虚拟世界中构建起，自己的经济、文化、宗教和政府。网友纷纷惊呼，西部世界真的来了。

世界首个「智能体文明」诞生了！

谁也不曾料到，1000多个智能体合作多日，竟在虚拟现实——「我的世界」中构建起了，真正的文化、经济、宗教、政府，等等等等......

这些智能体是完全自主的个体，而且还会利用工具、以及游戏实现目标。

它们能够分工，从无到有，一起收集300多个物品。

它们之间形成了一个交易市场，并以宝石（gem）作为统一的货币，完成物品交换，构建了一个自己的经济体系。

到这里，你可能会认为这些「商人」智能体是最会做贸易的「人」，那就大错特错了。

事实上，「牧师」智能体，才配享之最。

这是因为，他经常贿赂乡民，让其皈依他信仰的宗教。

除此之外，1000多个智能体开展的活动，几乎1:1复刻了人类世界。它们能够24小时，无间断在「我的世界」中参与活动，而且每天都有所不同。

人类文明几千年的历史，我们能够成为地球上登月唯一的物种，是因为能够进行大规模的合作。

现在看来，智能体同样可以做到。

网友们纷纷表示，这不就是现实版的《西部世界》。

甚至，还有人称，我们就生活在模拟世界中。

简直太疯狂了！

这个代号为「Sid」的项目，今天在AI圈里掀起了巨震。

值得一提的是，它是由北大校友、MIT教授Robert Yang发起，和Altera团队成员们将智能体以前所未有的规模组织起来，实现了单个智能体无法做到的事情。

在GPT-4加持下，1000多个智能体合作，不仅涌现出新的商业中心，还会参与民主投票、传播宗教等等。

而且，在基准测试中，Altera的智能体收集了，比以往多5倍的不同物品。

这一结果（32%），远远超过了英伟达Voyager、AutoGPT，以及普林斯顿谷歌提出的ReAct，是它们的5倍之多。

当AI不再是AI，而是有了灵魂的「人」

回归到具体场景中，当每个智能体全都被赋予了不同角色，便有了灵魂。

如同人类一样，在自己的世界中，认真地去生活。

Olivia的梦想

Olivia曾经是一位农民，为整个智能体文明系统提供食物。

有一天，他深受来村庄的一位探险家Nora故事的启发，决定放弃耕作一去探险。

但是，镇上的乡民们纷纷恳求他留下来，Olivia最后选择听从并放弃了自己的梦想，继续留在了村庄。

民主投票

接下来，研究人员还模拟了A和B两位政治领导人的「平行世界」。

在每个世界中，公民们都有一个共享的宪法文件，存储在谷歌文档中，它们可以通过投票以修改宪法。

在A的领导下，模拟世界通过了新的法律，并增加了警察的数量。

而在B的领导下，它们则专注于刑事司法改革、以及废除死刑等条例。

通过智能体之间政治交互，它们会随着时间成长，并会受到群体的影响。

正如「乌合之众」一书中，对人类社会中群体影响的分析，也出现在了智能体之间。

这听起来可能有些荒谬，但这也是我们首次看到智能体，能够形成一个民主制度来规束自己。

失踪的村民

当有村民丢失时，所有智能体便会停下手头工作，主动离开自己的岗位。

它们共同合作，用火炬点亮整个小镇，希望成为那位失踪村民的灯塔。

这当中，一个令人惊奇的发现是，一旦这些村民对同失踪的同伴感到担忧时，就会团结起来做规划。

目前，在Altera平台上，所有人皆可试玩智能体的游戏世界。其中，Elon、T-2000、Katniss深受大家喜欢。

试玩地址：https://playlabs.altera.al/discover

下面是，Altera联创出的一期教学视频，他以T2000为例，在我的世界中，让它帮自己寻找木锄头，仅在10步完成了任务。

这里还有一个教你玩游戏的智能体——Roshi。

当你告诉它自己不知道怎么玩，Roshi便会手把手教你，比如敲击树木，你照着做就可以了。

它还会教玩家，如何利用界面物品，制作工具，可以称得上是无所不能。

下面这位玩家，让Roshi跟随着自己，并告诉这只是一个恶作剧。没想到，Roshi使用了作弊代码，对齐进行了报复。

构建AI大脑

打造出这个智能体平台的创始科学家Peter Wang称，Altera正从0开始构建AI大脑。

他们将前额叶皮层与感知、运动、情感和记忆模块连接起来，创造出不仅高效而且富有人性的智能体。

这是神经科学家的梦想，不仅构建模拟大脑，还要观察、量化、干扰（perturb）社会互动。

想象一下，这就像是鱼群的集群行为，却需要用于进行人类级别复杂的社会行为，比如在经济贸易中物品交换、或对宪法投票。

这就是，Altera团队正在进行的一项工作。

他们每天都在努力解决一个深刻而基本的问题：

如何构建和量化那些使我们成为人类的特质——情感、目标设定、同理心、需求、欲望——而在这个过程中不失去其本质？

这一点至关重要，他们希望构建的智能体，能够超越表层的训练过程，去呈现人类的价值观。

Project Sid：真·自主AI智能体

构建一个由AI智能体组成的文明会是什么样子？

我们距离《西部世界》有多远？

我们能否使AI文明与人类文明保持一致？

在团队看来，Sid便是探索这些问题的第一步——最终将数字人无缝整合到人类社会中。

这里所说的真正自主的智能体，特指以下拥有这4种特质的AI：

1. 长期自主：能够独立运作数小时，甚至数天（而不仅仅是简单的函数调用「智能体」）

2. 组织性：能够相互协作以达成个体无法完成的任务（而不仅仅是为1000个客户服务1000个智能体）

3. 亲人类动机：拥有支持人类的深刻和强大的驱动力（而不仅仅是遵循指令的顺从机器）

4. 有意识的沟通：能够言语表达它们有意识的思想和感受（而不仅仅是语言条件反射的机器人）

为什么这些特质，在我们迈向下一个AI水平时显得尤为重要？

1. 人类无法像对待ChatGPT/Claude那样对每一个AI事无巨细地管理，它们必须更加自主。

2. 我们如何信任它们的自主决策？它们不能仅仅被训练成模仿人类。它们最深层的动机必须与人类的价值观相一致。

3. 它们不仅需要能够交流。它们的话语必须充分反映出它们内心的想法和决定。

4. 随着AI智能体成为我们人类文明的重要一部分，它们必须能够有效地与彼此以及我们其他人协作。

创新

一直以来，游戏（比如「我的世界」），都是测试新兴技术的极佳试验场。在游戏中，智能体行为的可靠性并不是必需的。

事实上，不可预测性甚至可以是一个特点，而不是一个漏洞。从而让研究人员能够更快地测试、迭代和发布。相比之下，生产力工具和辅助工具则需要更高的可靠性。

在开发Sid时，团队采用了很多创新的方法来提升智能体的社交能力、觉知和内部心理过程。

1. 对话

像人一样，智能体之间的对话不仅应取决于它们之前说过的话，还应取决于它们之间的关系。

为了实现真实的对话，团队在智能体的行为中构建了社会世界模型。其中，智能体会形成和更新其他智能体的模型——它们的行为、观点和需求，并利用这些信息在社交环境中进行对话和行为。

像人一样，智能体应该能够出于多种原因进行交流——表达自己的意图、闲聊、分享它们的希望和梦想。

为此，团队构建了一组对话模块。一方面可以让智能体的言语与它们的行动和意图一致，另一方面则是让智能体可以谈论与现实脱节的想法。

2. 强大的目标和意图管理

有组织的心理过程，可以支持智能体的社交行为和决策，考虑正在进行的事件和活动。

例如，团队为智能体提供了跟踪正在进行的活动并将这些事件整合成简明记忆的能力。这些补充对于减少无限行动循环——智能体的一个长期存在的问题——至关重要。

与此同时，为了让智能体能够灵活调整其行为来处理目标，团队还赋予了丰富的精神生活，这与即时的感官和运动反应分离。在这种精神生活中，智能体可以推理、反思，并生成或改变其目标以适应快速变化的环境。

架构

由于「大脑」是唯一经过验证的人类级智能体模型，因此团队提出了一种全新的「系统神经科学复合架构」。

其中，模型会去模拟前额叶皮层、记忆系统、社会情感状态等等。

挑战

和其他任何第一次尝试一样，Sid项目提出的问题多于它所能解答的问题：

1. 如何能以一种通用的方式有意义地衡量真正的长期进展？2. 如何构建真正关注人类发展的智能体？3. 如何构建对自己的行为及其后果具备意识的机器？4. AI文明可以被扩展到多大规模？

举例来说：

- 难以对文明进行评估

在「我的世界」中，团队使用了技术/工具进步、贸易活动、健康和协调/协作任务来对社会进步进行评估。虽然每个评估捕捉了社会的某些方面，但单纯地优化一个社会方面可能会导致其他方面的不足。

- 目标驱动的自主性和协作之间存在冲突

高效的技术进步，在较少沟通且高度目标导向的智能体中效果最佳。但如果智能体过于偏向于完成自己的目标，那么它们就会在需要灵活和动态目标设定的协作任务中失败。为此，智能体需要在保持内部目标驱动的同时，关注社会影响和动机。

- 单个智能体的缺陷缺陷将导致一系列逐渐偏离最初目标的行动

在一个场景中，老板将任务（例如制作铁镐）委派给经理，然后经理再委派给工人，团队成功的能力需要每个成员有效地沟通它们的目标并在这个社会层级中上下委派责任。

总的来说，想要回答这些问题，还需超越当前范式的研究及工程实践。

北大校友创业，打造有同理心AI

Robert Yang

Robert Yang是Altera的联合创始人兼CEO。

此前，他分别在纽约大学和耶鲁大学获得计算神经科学博士学位，在北大获得物理学学士学位。

他曾是MIT脑与认知科学系和电子工程与计算机科学系教授，以及MIT MetaConscious小组负责人。

2023年，他关闭了实验室并离开了麻省理工学院的终身教职，创立了Altera。

Altera的团队虽小，但人才密度极高——

由来自麻省理工学院电子工程与计算机科学系、斯坦福自然语言处理小组、Google X、Citadel、Supercell等的计算神经科学家、物理奥林匹克选手和工程师组成。

这家成立半年多的公司，年初得到了200万美金的种子融资，由Andreessen Horowitz领投。

三个月后，又再次融资900万美元，由谷歌前CEO埃里克·施密特的First Spark Ventures、Patron VC、天使投资人Mitch Lasky等人领投。

今年5月，Altera在Menlo Park设立了分店，并致力于成为首家智能体消费产品的供应商。

数字人会取代人类吗？

正如理查德·费曼所说：「凡我不能创造的，我就不能理解。」

创造数字人便是一个能更好地理解人性的方式——不仅要在个体层面上去理解，而且还必须通过群体、社会和文明的视角来观察。

那么，数字人类会取代真实的人类吗？

答案是——「不会」。

在团队看来，数字人是为了增强人类，而不是取而代之。

随着智能体交互质量的提高，文明的质量也会相应提高。

当突破某一关键阈值时，就会发生质变，正如语言模型在大到一定程度时会「涌现」一样，届时智能体文明将不仅能够自我维持，还能自我改进。

到那时，我们或许就可以拥抱一个数字人重新定义人类能力极限的世界了。

参考资料：

https://digitalhumanity.substack.com/p/project-sid

https://digitalhumanity.substack.com/p/building-digital-humans

https://x.com/GuangyuRobert/status/1831006762184646829

本文来自微信公众号“新智元”，编辑：桃子好困，36氪经授权发布。

近期资讯

富唯智能 2024-12-27

外贸独立站建站：如何选择合适的建站服务？

在外贸领域，拥有一个专业的独立站是企业拓展国际市场的重要一步。然而，面对众多的建站服务提供商，如何做出明智的选择呢？本文将深入探讨凡科、凡网云、盈建云三大建站服务，助您找到适合的外贸独立站建站解决方案。凡科建站服务凡科它提供了从域名注册到网站搭建、维护的全方位服务。凡科的优势在于：模板丰富：提供多种行业模板，快速搭建符合外贸企业需求的网站。操作简便：即使是建站新手，也能通过凡科的拖拽式编辑器轻松上手。多语言支持：支持多语言版本，帮助企业更好地服务全球客户。SEO优化：内置SEO工具，提高网站在搜索引擎中的

帆可云官网 2024-12-27

消除嘈杂,享受静谧时光 - 览邦LairPods Pro+降噪耳机的安静魔力

在这个喧嚣的时代,很多人都渴望找到一个属于自己的静谧空间,远离外界的噪音干扰,沉浸在内心的宁静之中。而这个梦想,正是览邦LairPods Pro+降噪耳机为我们实现的。记得第一次戴上这款耳机,我就被它的"静谧魔力"所征服。只见我轻轻打开降噪开关,耳畔的嘈杂声仿佛一下子消失殆尽,取而代之的是一片宁静祥和。无论我身处地铁、公交还是繁华街道,耳边都只有悦耳动听的音乐,以及内心深处的平静。开启降噪模式后，耳机的解析力更是得到了加强。在低频下潜方面更加凝练有力，同时对中高频的细节处理也极为到位，呈现出更加干净细腻的

bili_86176276645 2024-12-27

必知！关于虹膜识别技术的十大关键问题解答，你了解多少？

虹膜门禁思源科安 2024-12-27

2025新年好物大集合！这十大数码好物让你新年倍儿有面儿！

随着2024年的脚步渐行渐远，新的一年即将到来。转眼间，我们即将迎来充满希望和机遇的2025年。在这个辞旧迎新的时刻，为自己准备一份特别的新年礼物，不仅是对自己过去一年辛勤付出的奖励，更是对新一年美好生活的期盼。新年不仅是家人团聚、朋友相聚的美好时刻，也是展示自我品味和生活态度的最佳时机。无论是为了犒劳自己，还是为了给亲朋好友送上一份心意满满的礼物，选择一件合适的数码产品无疑是不错的选择。这些数码产品不仅能提升我们的生活质量，更能彰显出我们的时尚品味和科技实力。 [图片] 在这篇文章中，我们将为大家精选

御海蓝桉 2024-12-27

百元头戴式蓝牙耳机推荐：西圣H1亲测好用

冬天到了，上下班戴着开放式蓝牙耳机听歌，开始觉得，有点冻地耳朵扛不住了，戴上护耳又影响听歌效果。突然就想起来头戴式蓝牙耳机，防风护耳、听歌运动，鱼和熊掌也可兼得。最近上手了这款西圣H1头戴式蓝牙耳机，使用了一段时间后，觉得还不错，非常值得推荐。首先，产品好不好，开箱必不可少。拿到产品是一个白色的方向大盒子，正面有素描的头戴式耳机样张，左上方是“XISEM西圣”的LOGO，有下角圈出了主动降噪的特点。背面是产品详情，可以看到型号“XISEM-H1”,可以看到蓝牙15米，能听歌20小时，续航还不错

科技观察员 2024-12-27

安天网络行为检测能力升级通告（20241222）

安天长期基于流量侧数据跟踪分析网络攻击活动，识别和捕获恶意网络行为，研发相应的检测机制与方法，积累沉淀形成了安天自主创新的网络行为检测引擎。安天定期发布最近的网络行为检测能力升级通告，帮助客户洞察流量侧的网络安全威胁与近期恶意行为趋势，协助客户及时调整安全应对策略，赋能客户提升网络安全整体水平。一、安天网络行为检测能力概述安天网络行为检测引擎收录了近期流行的网络攻击行为特征。本期新增检测规则225条，升级改进检测规则162条，网络攻击行为特征涉及变种木马、代码执行等高风险，涉及SQL注入、文件写入等中风险

安天科技 2024-12-27

企业安全的利器：七款热门网络准入控制产品功能测评

随着企业数字化转型的推进，网络安全面临前所未有的挑战。为了确保企业网络的高效与安全，网络准入控制（Network Access Control, NAC）成为不可或缺的一环。本文精选七款热门网络准入控制产品，深度剖析其功能与特点，助力企业挑选最佳解决方案。 [图片] 1. OneNAC 适用场景：中小型企业、混合网络环境功能亮点：终端身份验证：支持多种认证方式（账号密码、证书、指纹等），确保设备安全接入。实时网络可视化：提供所有接入设备和用户的实时状态图，便于快速响应异常。灵活权限管理：基于角色的

安在软件 2024-12-27