当前位置:首页|资讯|北大

1000个智能体创建首个「AI文明」,北大校友放弃MIT教职打造「西部世界」

作者:新智元发布时间:2024-09-04

【导读】在我的世界里,出现了有史以来第一个智能体文明。1000多个智能体一同协作,在虚拟世界中构建起,自己的经济、文化、宗教和政府。网友纷纷惊呼,西部世界真的来了。

世界首个「智能体文明」诞生了! 

谁也不曾料到,1000多个智能体合作多日,竟在虚拟现实——「我的世界」中构建起了,真正的文化、经济、宗教、政府,等等等等...... 

这些智能体是完全自主的个体,而且还会利用工具、以及游戏实现目标。 

它们能够分工,从无到有,一起收集300多个物品。 

它们之间形成了一个交易市场,并以宝石(gem)作为统一的货币,完成物品交换,构建了一个自己的经济体系。 

到这里,你可能会认为这些「商人」智能体是最会做贸易的「人」,那就大错特错了。 

事实上,「牧师」智能体,才配享之最。 

这是因为,他经常贿赂乡民,让其皈依他信仰的宗教。 

除此之外,1000多个智能体开展的活动,几乎1:1复刻了人类世界。它们能够24小时,无间断在「我的世界」中参与活动,而且每天都有所不同。 

人类文明几千年的历史,我们能够成为地球上登月唯一的物种,是因为能够进行大规模的合作。 

现在看来,智能体同样可以做到。 

网友们纷纷表示,这不就是现实版的《西部世界》。 

甚至,还有人称,我们就生活在模拟世界中。 

简直太疯狂了! 

这个代号为「Sid」的项目,今天在AI圈里掀起了巨震。 

值得一提的是,它是由北大校友、MIT教授Robert Yang发起,和Altera团队成员们将智能体以前所未有的规模组织起来,实现了单个智能体无法做到的事情。 

在GPT-4加持下,1000多个智能体合作,不仅涌现出新的商业中心,还会参与民主投票、传播宗教等等。 

而且,在基准测试中,Altera的智能体收集了,比以往多5倍的不同物品。 

这一结果(32%),远远超过了英伟达Voyager、AutoGPT,以及普林斯顿谷歌提出的ReAct,是它们的5倍之多。 

当AI不再是AI,而是有了灵魂的「人」

回归到具体场景中,当每个智能体全都被赋予了不同角色,便有了灵魂。 

如同人类一样,在自己的世界中,认真地去生活。 

Olivia的梦想

Olivia曾经是一位农民,为整个智能体文明系统提供食物。 

有一天,他深受来村庄的一位探险家Nora故事的启发,决定放弃耕作一去探险。 

但是,镇上的乡民们纷纷恳求他留下来,Olivia最后选择听从并放弃了自己的梦想,继续留在了村庄。 

民主投票

接下来,研究人员还模拟了A和B两位政治领导人的「平行世界」。 

在每个世界中,公民们都有一个共享的宪法文件,存储在谷歌文档中,它们可以通过投票以修改宪法。 

在A的领导下,模拟世界通过了新的法律,并增加了警察的数量。 

而在B的领导下,它们则专注于刑事司法改革、以及废除死刑等条例。 

通过智能体之间政治交互,它们会随着时间成长,并会受到群体的影响。 

正如「乌合之众」一书中,对人类社会中群体影响的分析,也出现在了智能体之间。 

这听起来可能有些荒谬,但这也是我们首次看到智能体,能够形成一个民主制度来规束自己。 

失踪的村民

当有村民丢失时,所有智能体便会停下手头工作,主动离开自己的岗位。 

它们共同合作,用火炬点亮整个小镇,希望成为那位失踪村民的灯塔。 

这当中,一个令人惊奇的发现是,一旦这些村民对同失踪的同伴感到担忧时,就会团结起来做规划。 

目前,在Altera平台上,所有人皆可试玩智能体的游戏世界。其中,Elon、T-2000、Katniss深受大家喜欢。 

试玩地址:https://playlabs.altera.al/discover 

下面是,Altera联创出的一期教学视频,他以T2000为例,在我的世界中,让它帮自己寻找木锄头,仅在10步完成了任务。

这里还有一个教你玩游戏的智能体——Roshi。

当你告诉它自己不知道怎么玩,Roshi便会手把手教你,比如敲击树木,你照着做就可以了。 

它还会教玩家,如何利用界面物品,制作工具,可以称得上是无所不能。 

下面这位玩家,让Roshi跟随着自己,并告诉这只是一个恶作剧。没想到,Roshi使用了作弊代码,对齐进行了报复。 

构建AI大脑

打造出这个智能体平台的创始科学家Peter Wang称,Altera正从0开始构建AI大脑。 

他们将前额叶皮层与感知、运动、情感和记忆模块连接起来,创造出不仅高效而且富有人性的智能体。 

这是神经科学家的梦想,不仅构建模拟大脑,还要观察、量化、干扰(perturb)社会互动。 

想象一下,这就像是鱼群的集群行为,却需要用于进行人类级别复杂的社会行为,比如在经济贸易中物品交换、或对宪法投票。 

这就是,Altera团队正在进行的一项工作。 

他们每天都在努力解决一个深刻而基本的问题: 

如何构建和量化那些使我们成为人类的特质——情感、目标设定、同理心、需求、欲望——而在这个过程中不失去其本质? 

这一点至关重要,他们希望构建的智能体,能够超越表层的训练过程,去呈现人类的价值观。 

Project Sid:真·自主AI智能体

构建一个由AI智能体组成的文明会是什么样子? 

我们距离《西部世界》有多远? 

我们能否使AI文明与人类文明保持一致? 

在团队看来,Sid便是探索这些问题的第一步——最终将数字人无缝整合到人类社会中。 

这里所说的真正自主的智能体,特指以下拥有这4种特质的AI: 

1. 长期自主:能够独立运作数小时,甚至数天(而不仅仅是简单的函数调用「智能体」) 

2. 组织性:能够相互协作以达成个体无法完成的任务(而不仅仅是为1000个客户服务1000个智能体) 

3. 亲人类动机:拥有支持人类的深刻和强大的驱动力(而不仅仅是遵循指令的顺从机器) 

4. 有意识的沟通:能够言语表达它们有意识的思想和感受(而不仅仅是语言条件反射的机器人) 

为什么这些特质,在我们迈向下一个AI水平时显得尤为重要? 

1. 人类无法像对待ChatGPT/Claude那样对每一个AI事无巨细地管理,它们必须更加自主。 

2. 我们如何信任它们的自主决策?它们不能仅仅被训练成模仿人类。它们最深层的动机必须与人类的价值观相一致。 

3. 它们不仅需要能够交流。它们的话语必须充分反映出它们内心的想法和决定。 

4. 随着AI智能体成为我们人类文明的重要一部分,它们必须能够有效地与彼此以及我们其他人协作。 

创新

一直以来,游戏(比如「我的世界」),都是测试新兴技术的极佳试验场。在游戏中,智能体行为的可靠性并不是必需的。 

事实上,不可预测性甚至可以是一个特点,而不是一个漏洞。从而让研究人员能够更快地测试、迭代和发布。相比之下,生产力工具和辅助工具则需要更高的可靠性。 

在开发Sid时,团队采用了很多创新的方法来提升智能体的社交能力、觉知和内部心理过程。 

1. 对话 

像人一样,智能体之间的对话不仅应取决于它们之前说过的话,还应取决于它们之间的关系。 

为了实现真实的对话,团队在智能体的行为中构建了社会世界模型。其中,智能体会形成和更新其他智能体的模型——它们的行为、观点和需求,并利用这些信息在社交环境中进行对话和行为。 

像人一样,智能体应该能够出于多种原因进行交流——表达自己的意图、闲聊、分享它们的希望和梦想。 

为此,团队构建了一组对话模块。一方面可以让智能体的言语与它们的行动和意图一致,另一方面则是让智能体可以谈论与现实脱节的想法。 

2. 强大的目标和意图管理 

有组织的心理过程,可以支持智能体的社交行为和决策,考虑正在进行的事件和活动。 

例如,团队为智能体提供了跟踪正在进行的活动并将这些事件整合成简明记忆的能力。这些补充对于减少无限行动循环——智能体的一个长期存在的问题——至关重要。 

与此同时,为了让智能体能够灵活调整其行为来处理目标,团队还赋予了丰富的精神生活,这与即时的感官和运动反应分离。在这种精神生活中,智能体可以推理、反思,并生成或改变其目标以适应快速变化的环境。 

架构

由于「大脑」是唯一经过验证的人类级智能体模型,因此团队提出了一种全新的「系统神经科学复合架构」。 

其中,模型会去模拟前额叶皮层、记忆系统、社会情感状态等等。 

挑战

和其他任何第一次尝试一样,Sid项目提出的问题多于它所能解答的问题: 

1. 如何能以一种通用的方式有意义地衡量真正的长期进展?2. 如何构建真正关注人类发展的智能体?3. 如何构建对自己的行为及其后果具备意识的机器?4. AI文明可以被扩展到多大规模? 

举例来说: 

- 难以对文明进行评估 

在「我的世界」中,团队使用了技术/工具进步、贸易活动、健康和协调/协作任务来对社会进步进行评估。虽然每个评估捕捉了社会的某些方面,但单纯地优化一个社会方面可能会导致其他方面的不足。 

- 目标驱动的自主性和协作之间存在冲突 

高效的技术进步,在较少沟通且高度目标导向的智能体中效果最佳。但如果智能体过于偏向于完成自己的目标,那么它们就会在需要灵活和动态目标设定的协作任务中失败。为此,智能体需要在保持内部目标驱动的同时,关注社会影响和动机。 

- 单个智能体的缺陷缺陷将导致一系列逐渐偏离最初目标的行动 

在一个场景中,老板将任务(例如制作铁镐)委派给经理,然后经理再委派给工人,团队成功的能力需要每个成员有效地沟通它们的目标并在这个社会层级中上下委派责任。 

总的来说,想要回答这些问题,还需超越当前范式的研究及工程实践。 

北大校友创业,打造有同理心AI

Robert Yang

Robert Yang是Altera的联合创始人兼CEO。 

此前,他分别在纽约大学和耶鲁大学获得计算神经科学博士学位,在北大获得物理学学士学位。 

他曾是MIT脑与认知科学系和电子工程与计算机科学系教授,以及MIT MetaConscious小组负责人。 

2023年,他关闭了实验室并离开了麻省理工学院的终身教职,创立了Altera。 

Altera的团队虽小,但人才密度极高—— 

由来自麻省理工学院电子工程与计算机科学系、斯坦福自然语言处理小组、Google X、Citadel、Supercell等的计算神经科学家、物理奥林匹克选手和工程师组成。 

这家成立半年多的公司,年初得到了200万美金的种子融资,由Andreessen Horowitz领投。 

三个月后,又再次融资900万美元,由谷歌前CEO埃里克·施密特的First Spark Ventures、Patron VC、天使投资人Mitch Lasky等人领投。 

今年5月,Altera在Menlo Park设立了分店,并致力于成为首家智能体消费产品的供应商。 

数字人会取代人类吗?

正如理查德·费曼所说:「凡我不能创造的,我就不能理解。」 

创造数字人便是一个能更好地理解人性的方式——不仅要在个体层面上去理解,而且还必须通过群体、社会和文明的视角来观察。 

那么,数字人类会取代真实的人类吗? 

答案是——「不会」。 

在团队看来,数字人是为了增强人类,而不是取而代之。 

随着智能体交互质量的提高,文明的质量也会相应提高。 

当突破某一关键阈值时,就会发生质变,正如语言模型在大到一定程度时会「涌现」一样,届时智能体文明将不仅能够自我维持,还能自我改进。 

到那时,我们或许就可以拥抱一个数字人重新定义人类能力极限的世界了。 

参考资料: 

https://digitalhumanity.substack.com/p/project-sid 

https://digitalhumanity.substack.com/p/building-digital-humans 

https://x.com/GuangyuRobert/status/1831006762184646829 

本文来自微信公众号“新智元”,编辑:桃子 好困 ,36氪经授权发布。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1