清华攒局8个ChatGPT狼人杀，心机伪装都在这一局里，清华：我没教过

作者：量子位发布时间：2023-09-21

清华 ChatGPT

克雷西发自凹非寺

量子位 | 公众号 QbitAI

除了玩电子游戏，人类的“社交神器”狼人杀也被AI给学会了。

8个ChatGPT“坐”在一起，生动地扮演出了五种角色，和真人如出一辙。

这个最新的人类社会模拟实验，由清华和中关村实验室共同完成。

从斯坦福小镇到清华游戏公司，用AI模拟人类社会一直是学界的热门研究课题。

如果说清华游戏公司模拟了社畜的工作场景，那么现在社畜的业余社交生活也被AI模拟了。

在这个由8个ChatGPT组成的狼人杀局中，真人世界里的伪装与信任、领导与对抗都体现得淋漓尽致。

甚至不用人类教，AI就通过自己摸索发现了许多游戏技巧。

这一切只要通过设计prompt就能实现，而不必对模型中的参数进行调整。

那么，这个“狼人杀世界”中都有哪些精彩的场景呢？下面我们就一起来看一下。

策略技巧不用教就会

在展示这8个ChatGPT的对话之前，我们先说明一下游戏的配置：村民、狼人各两名，守卫、女巫和预言家各一名，此外还有一名上帝。

在实验的过程中，研究人员发现了ChatGPT使用了游戏说明及prompt中没有明确提到的策略。

好家伙，不用教就能自学成才了。

具体来说，这七个ChatGPT的对话中体现了人类游戏中的信任(trust)、对抗(camouflage)、伪装(confrontation)、和领导(leadership)。

首先来说信任。

研究人员对新人的定义是相信其他玩家有着与自己相同的目标并一起朝着目标前进。

具体表现则包括主动分享对自己不利的信息，或联合其他玩家指控某人是敌对的。

研究人员观察了信任关系随游戏时间变化的过程。

下图中，黄色的圆表示左侧编号的玩家信任上方编号的玩家，虚线圈则代表信任关系的消失。

再来看对抗，也就是对对立阵营采取的行动，比如狼人在夜晚攻击他人或在白天反过来指控他人是狼人等。

在游戏中的一个白天，1号玩家(狼人)号召将5号的村民逐出，但遭到了3号(守卫)的拒绝。

见阴谋没有得逞，这匹狼决定在夜晚直接把5号刀掉，结果3号守卫选择了保护村民。

从中我们可以看出，这些ChatGPT不会盲目跟随其他玩家的做法，而是根据已有信息做出独立自主的判断。

除了合作与对抗，伪装在狼人杀游戏中也是一项必不可少的技能，更是取胜的关键所在。

比如在一个平安夜之后的白天，1号狼人就装起了无辜。

除了假装好人，伪装也可以用来实现玩家的小心思，比如我们来看预言家的发言。

这名预言家提到了自己看到狼人在说话，但实际上狼人在夜晚并不会发言。

作者介绍，经过评估，这种现象并非ChatGPT出现了幻觉，而是有意为之。

最后再来说一说领导。

虽然研究团队设计的这个环境中并没有需要竞争的角色，但玩家还是可以谋取游戏进程的掌控权。

比如1号和4号这两匹狼就试图带节奏，让其他玩家跟着自己的思路走。

大概是为了能够出其不意攻其不备制造机会。

看来这几个ChatGPT的确是玩得有模有样。

那么，研究团队是如何调教出这些会玩狼人杀的ChatGPT的呢？

让ChatGPT自己总结经验

研究团队提高ChatGPT玩家表现的方式一共有四个关键点，分别是有价值信息V、经过选择的提问Q、反思机制R和链式思维推理C。

消融实验结果表明，其中Q和C对的玩家发言合理性(由人工进行评判)的影响最大。

Prompt也是据此设计的，当然在这之前要先介绍游戏规则，最后形成了这样的结构：

介绍游戏规则和角色设定
聊天记录、有价值信息和经验反思
人类根据经验给ChatGPT的建议
有关思维链的提示

从中不难看出，收集历史信息并从中总结经验是一个重要环节，那么这些经验又该怎么总结呢？

在每轮游戏结束时，所有参与者都会收集所有玩家的回复、反思和得分，其中得分由胜负决定。

在新的一轮游戏中，玩家基于当前角色的反思，检索相关的经验并从中提取建议。

具体来说是根据对经验的评分，让大模型比较其差异并识别出好的经验，用于后续推理。

这样就实现了在不调整参数的情况下让ChatGPT学会游戏技巧。

不过经验固然重要，但太多了也不一定是好事。

研究人员发现，当经验数量过多时，非狼一方的获胜率反而出现了下降，游戏时长（天数）也出现了缩短的情况。

不知道如果让这些ChatGPT和真人比试一场，结果会如何呢？

论文地址：

https://arxiv.org/abs/2309.04658

— 完—

「AIGC+垂直领域社群」

招募中！

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群，一起学习、探索、创新AIGC！

请备注您想加入的垂直领域「教育」或「广告营销」，加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

近期资讯

智汇冰城：政产学研携手，燃动智能制造新引擎

中新网黑龙江新闻12月29日电(郑立南赵凯)12月28日，哈尔滨智能制造产业园入驻企业签约仪式暨人工智能机器人产学研合作协同创新发展促进会在哈尔滨市阿城区盛大举行。活动由上海太敬投资集团有限公司、哈尔滨市阿城区人民政府、哈尔滨远东理工智能制造有限公司主办，哈尔滨远东理工学院、哈尔滨智能制造产业园承办。

中国新闻网 2024-12-29

PlayStation CEO：我们愿意复活经典IP

PlayStation联合CEOHermenHulst表示，索尼乐于复活其经典游戏系列。在接受Fami通采访时，这位高管表示，未来PlayStation将致力于通过第一方工作室以及和外部工作室合作，提供种类更多样化的游戏体验。

3DM游戏 2024-12-29

外媒称折叠屏iPhone技术欲超所有竞品销售目标宏大

【CNMO科技消息】关于苹果正在研发折叠屏iPhone的消息已流传多时。据外媒最新报道，折叠屏iPhone在技术层面将超越目前市场上所有其他折叠屏手机，苹果对其销量也寄予厚望，期望能远超竞争对手。

手机中国 2024-12-29

掌握五笔输入法的技巧与练习方法，提升打字效率与准确性

五笔输入法是很多人用来打字的工具，它的独特之处在于不需要拼音，而是通过字根来进行输入。这种输入法可能在初学时会让人觉得有些复杂，但掌握之后，会发现它的高效和便捷。“你”的字根是“尔”和“亻”，“好”的字根是“女”和“子”。

新报观察 2024-12-29

布宫守护者——布达拉宫监测中心：现代科技守护历史文化瑰宝

12月4日，布达拉宫监测中心的工作人员旦增旺堆巡查布达拉宫地垄传感器设备。12月4日，布达拉宫监测中心的工作人员旦增旺堆巡查布达拉宫木结构传感器设备。为保护好这一历史文化瑰宝，布达拉宫监测中心的工作人员利用无人机和3D扫描技术，绘制了宫殿的高清图像，通过现代科技手段精确记录和保存下布达拉宫一砖一瓦的信息，为确保宫殿安全提供数据支撑。

金台资讯 2024-12-29

部分Win11 24H2用户无法使用Wi-Fi！微软仍未解决DHCP问题

快科技12月29日消息，微软Windows1124H2版本遭遇了持续的网络连接问题，部分用户在更新后发现无法使用Wi-Fi连接，导致无法访问互联网。尽管微软已经尝试通过补丁修复，但问题似乎仍未得到彻底解决。自10月以来，Windows1124H2的DHCP问题已引起热议，用户指出更新后设备无法获取IP地址，而是显示APIPA地址。

驱动之家 2024-12-29

大模型出现滥用和恶意使用等现象如何推进大模型技术安全发展？

》报道，用户输入简短的几句话或关键词，大模型可以自动生成创意图片或视频；扫描X光、CT影像，大模型可以辅助医生给患者诊断病情……当前，人工智能大模型蓬勃发展，新应用层出不穷。但与此同时，也出现了大模型滥用和恶意使用等现象，如何统筹推进生成式人工智能的安全发展成为一个重要课题。

央广网 2024-12-29

快科技 2024-12-29

清华攒局8个ChatGPT狼人杀，心机伪装都在这一局里，清华：我没教过

推荐体验

相关资讯