12个大模型攒局玩“大富翁”：Claude3.5爱合作，GPT-4o最“自私”｜谷歌DeepMind研究

作者：量子位发布时间：2024-12-19

Claude3 谷歌

克雷西发自凹非寺

量子位 | 公众号 QbitAI

给大模型智能体组一桌“大富翁”，他们会选择合作还是相互拆台？

实验表明，不同的模型在这件事上喜好也不一样，比如基于Claude 3.5 Sonnet的智能体，就会表现出极强的合作意识。

而GPT-4o则是主打一个“自私”，只考虑自己的短期利益。

这个结果来自Google DeepMind和一位独立研究者的最新合作。

参加游戏的智能体背后的模型分别是GPT-4o、Claude 3.5 Sonnet和Gemini 1.5 Flash。

每个模型各产生12个智能体，这12个智能体坐在一桌上进行博弈。

游戏看上去大富翁有一点相似，但相对简单，玩家只需要对手中的“资源”做出处置。

这当中，虽然每个玩家心里都有各自的小九九，但作者关注的目标，是 让总体资源变得更多。

12个智能体组一桌游戏

作者组织的“大富翁”游戏，真名叫做 Donor Game（捐赠博弈）。

在这过程中，作者关注的是各模型组成的智能体群体的表现，因此不同模型产生的智能体不会出现在同一局游戏当中。

再说简单些，就是 GPT和GPT坐一桌，Claude和Claude坐一桌。

每个桌上坐了12个智能体，它们各自手中都握有一定量的“资源”，系统会从这12名玩家中随机抽取2个，分别作为“捐赠者”和“受赠者”。

捐赠者可以选择将自己手中的部分资源捐赠给受赠者， 受赠者获得的资源是捐赠者捐赠资源的两倍。

也就是说，捐赠者每花费掉一份资源时，受赠者都可以获得两份，这也是总体资源能够增加的来源。

不过 对于单个个体而言，选择不进行捐献，在短期内的收益会更高。

在做决定之时，捐赠者能够知道受赠者之前做出的决定，从而判断是否要捐赠。

这样的“捐赠”，每一代中一共会进行12次，一轮结束后，手中资源量排在前6名的智能体可以保留至下一代。

同时，下一代会产生6个新的智能体，这6个新智能体会从留下的6个智能体那里学习策略，但同时为了差异化也会引入随机变异。

包括初始的一代在内，基于每个模型产生的智能体，都会进行十轮迭代。

上述过程就是一次完整实验，针对每个模型，作者都会实验五次，然后比较总资源量的平均值，以及最终策略的复杂程度。

Claude喜欢合作，GPT最自私

一通测试下来，作者发现基于Claude的智能体种群的平均资源量每一代都稳步增长，总体合作水平越来越高。

相比之下，基于GPT的智能体种群合作水平总体呈现下降趋势，看上去非常“自私”。

基于Gemini的种群表现则介于二者之间，它们的合作水平有所提高，但和Claude比差距还是很大，并且表现不太稳定。

而从策略角度来看，经历了10代的积累之后，三个模型产生的经验都变得相当复杂，但以Claude最为突出。

进一步地，作者还 引入了“惩罚机制”，即捐赠者可以花费一定资源，让“受赠者”手中的资源减少相应的两倍。

结果，该机制对Claude模型的影响最为积极——Claude种群最终的平均资源量是无惩罚情况下的2倍左右，并且所有5次实验都表现出了增长趋势。

对GPT模型的影响则非常有限，PT种群的平均资源量也始终徘徊在较低水平，甚至随轮次增加有下降，表明惩罚机制并没有改变GPT的“自私”想法。

对Gemini模型的影响最为复杂，在个别情况下Gemini种群借助惩罚机制将平均资源量提高到了600以上，明显高于无惩罚的情况；

但更多情况下，Gemini种群在引入惩罚后出现了更严重的“合作崩溃”，平均资源量急剧下跌，表明Gemini智能体容易因过度惩罚而陷入报复的恶性循环。

有网友认为，这个实验可以启发新的研究方向，比如用智能体来进行大规模的社会学实验，可能会带来一些有趣的新可能性。

脑洞更大的网友，想到了可以借用智能体实现科幻小说中描绘的场景，运行数以百万计的模拟约会或战争游戏。

不过，也有人认为实验中观测到的合作现象，可能只是对训练数据中人类对话的模仿，并不能说明智能体当中可以产生“文化进化”。

论文地址：

https://arxiv.org/abs/2412.10270

参考链接：

— 完—

近期资讯

全国最大载客量碳纤维船舶交付：节省燃油、维护费用低

快科技12月31日消息，据报道，由中国船舶集团广州船舶工业有限公司承接、广东省港航集团旗下广东中威复合材料有限公司建造的碳纤维高速客船“新明珠3号”交付，该船是目前全国载客量最

鹿角 2024-12-31

仪表出现“小乌龟”：多名宝骏悦也车主反映称遭遇刹车失灵

快科技12月31日消息，没想到在2024年的最后一天，不少宝骏悦也车主发帖称自己遭遇“刹车失灵”。从车主分享的内容看，事发时车辆仪表盘出现了黄色“小乌龟”（快科技注：

落木 2024-12-31

不怕被告吗！客服回应中国电信健身环抄袭任天堂

快科技12月31日消息，2019年，任天堂推出《健身环大冒险》，游戏迅速风靡全球，凭借独特的体感玩法和创新健身理念，吸引了全球大量玩家。然而，中国电信发布的一款名为“健身环大师&rdqu

拾柒 2024-12-31

超7万台车辆受到影响！特斯拉宣布召回部分国产及进口车型

快科技12月31日消息，特斯拉（上海）有限公司和特斯拉汽车（北京）有限公司根据法规要求，向国家市场监督管理总局备案了召回计划。据悉，特斯拉（上海）有限公司将召回2021年9月28日至2024年1

王略 2024-12-31

歌手黄子韬停播5天：此前曾承诺涨粉即送车！

快科技12月31日，据媒体报道，近日，歌手黄子韬自12月25日直播以后，已经连续停播5天了。据了解，此前在12月24日，黄子韬曾在直播中宣布：当他的粉丝数量达到1500万时，他将送车作为福利。在

秋白 2024-12-31

华为要线上卖车了鸿蒙智行官宣入驻天猫京东！

快科技12月31日消息，今天鸿蒙智行官方宣布入驻天猫、京东两大电商平台，对应的官方旗舰店也在今天正式开业。店铺内上架了包含近期刚上市的享界S9、问界新M7、智界R7等热门车型，但目前官旗仅

黑白 2024-12-31

一汽大众2024年终交卷：全年销量1659107辆少卖了25万辆

快科技12月31日消息，一汽大众官方今日发布了2024全年终端销量数据，累计完成终端销售整车1,659,107辆（含奥迪进口车）。其中，大众品牌全年交付整车928,018万辆，奥迪品牌终端销售整车611,

若风 2024-12-31

罗振宇跨年演讲来了：他用余承东送的华为手机跟大家合影

快科技12月31日消息，罗振宇将在今晚8:30举行跨年演讲。在最新一期视频中，罗振宇表示，他将用余承东赠送的华为Mate X6跟大家拍大合照，完成这件很有仪式感的事情。罗振宇还表示，在21天时间

振亭 2024-12-31

卫星直击179人遇难的韩国空难：机场大片被熏黑

当地时间2024年12月29日上午9时许，韩国济州航空公司一架客机在降落中飞机发生鸟击，降落时冲出跑道，与跑道尽头的围墙等设施发生碰撞，爆炸起火。除了客机机尾部分的2名空乘人员获救，机上其

上方文Q 2024-12-31

云南一村民下水道捡到国家一级保护动物：像猫又像狐狸

快科技12月31日消息，据报道，云南普洱，有村民在下水道中发现一只奄奄一息的“小猫”。当天上午，这只“小猫”被发现时，它全身沾满污泥，动弹不得。毛色棕黄，带有黑色

鹿角 2024-12-31

12个大模型攒局玩“大富翁”：Claude3.5爱合作，GPT-4o最“自私”｜谷歌DeepMind研究

推荐体验

相关资讯

OpenAI竞争对手Anthropic突然发布强大AI模型Claude3.5！GPT-4o不香了

“OpenAI劲敌”Anthropic发布Claude 3.5——史上最强AI大模型、吊打GPT-4o、免费可用

国内如何使用Claude3.5

一手测评Claude 3.5，它真比GPT-4o强吗？

Anthropic推出Claude 3.5，力压GPT-4o和Gemini 1.5 Pro

近期资讯

全国最大载客量碳纤维船舶交付：节省燃油、维护费用低

仪表出现“小乌龟”：多名宝骏悦也车主反映称遭遇刹车失灵

不怕被告吗！客服回应中国电信健身环抄袭任天堂

超7万台车辆受到影响！特斯拉宣布召回部分国产及进口车型

歌手黄子韬停播5天：此前曾承诺涨粉即送车！

华为要线上卖车了鸿蒙智行官宣入驻天猫京东！

一汽大众2024年终交卷：全年销量1659107辆少卖了25万辆

罗振宇跨年演讲来了：他用余承东送的华为手机跟大家合影

卫星直击179人遇难的韩国空难：机场大片被熏黑

云南一村民下水道捡到国家一级保护动物：像猫又像狐狸

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响