微软研究员曾指出,像ChatGPT这样生成式AI产品具备逻辑推理、抽象思考、理解复杂想法等拟人化能力,但并非完美无瑕,因为没有记忆、规划和反思的能力。
斯坦福研究中心发布了一篇名为《Generative Agents: Interactive Simulacra of Human Behavior》的论文。展示了让生成式AI具备记忆、规划、沟通和反思的能力,让其像人类一样自然活动、社交、成长。
经过2天的模拟测试发现了惊人的结果:1)AI自己建立了记忆体系并定期进行深层次反思,从而获得对新鲜事物的见解;2)AI之间建立了关系并记住了彼此;3)AI之间学会了相互协调;4)AI之间学会了共享信息;5)AI具备了定制和修改计划的能力。
当斯坦福在社交平台公布这些发现时瞬间引起了广泛热议,不少人表示,生成式AI技术将迎来重大突破,强化记忆、检索、交互的能力。
论文地址:https://arxiv.org/abs/2304.03442
演示地址:https://reverie.herokuapp.com/arXiv_Demo/
模拟演示值得一提的是,本次实验斯坦福使用的是GPT-3.5-turbo版本的ChatGPT,也就是说理论上可以为ChatGPT加上记忆、反思和规划等更高阶的人类能力,可有效提升大语言模型输出能力、稳定性和降低风险,同时在游戏领域有着巨大的应用空间。
我们不止一次的讨论AI何时才能像电影《我,机器人》、《她》那样具备自我觉醒的能力。现在来看,通过Generative Agents这项技术将加速AI的觉醒和拟人化进程。
下面「AIGC开放社区」用简单、直接的方式为大家介绍本次模拟实验和结果。
生成代理模拟实验介绍
生成代理(Generative Agents),是一种新颖的架构,使AI能够记住、检索、反映、与其他AI之间的交互,并通过动态变化的环境进行规划。
该架构利用大型语言模型的强大提示功能,并补充这些功能以支持长期代理的一致性、管理动态演化内存的能力以及递归产生更多世代。
斯坦福在本次实验中使用的是沙盒环境进行模拟测试,是一个小镇子有咖啡馆、商店、房子、酒吧、商店、桌子、书架、鲜花、厨房、壁橱、浴室等海量物品,几乎和现实世界一模一样。
人物是25名生成代理,他们拥有不同的姓名、年龄、个性、职业、爱好等。每天要做的事情也各不相同,例如,通用动作起床、睡觉、打招呼、吃早饭等;艺术家会画画,作家会写作,科学家会进行研究,演员会进行喜剧表演等。
主要行为动作:日常动作(刷牙、洗脸、吃饭等)、AI之间交流、约会聚餐、拥有心理活动、记录日记、定期进行反思、制定发展规划等,整体和人类几乎一样。
在模拟的过程中,研究人员可以向每一位生成代理提问题、干预他们的计划等,以查看AI的各项能力的表现。
AI惊人的表现
随着25名生成代理之间的交互增多产生新的数据并且代理不停的反思、制定计划等,研究团队主要发现了以下5点惊人的表现:
1)AI自己建立了记忆体系并定期进行深层次反思,从而获得对新鲜事物的见解:阿伊莎汗在写关于莎士比亚毕业论文时,会定期与梅林讨论提高论文的写作技巧,并用于改善论文的质量。
2)AI之间建立了关系并记住了彼此:最初,山姆和托亚并不认识。当他们在公园见面时,托亚对山姆说她正在进行一个摄像项目。当山姆与托亚再次遇见时,山姆主动说,托亚你的摄影项目进行的如何了。
3)AI之间学会了相互协调:伊莎贝拉邀请她看到的人参加聚会,并向玛利亚求助进行装饰场地。
4)AI之间学会了共享信息:当山姆决定竞选小镇镇长与汤姆进行了分享,约翰也听到了这个消息。当晚,汤姆和约翰分别提出了山姆的候选资格和获胜的机会。
此外,当伊莎贝拉计划举办情人节派对时,就广为流传。到模拟结束时,一共有12个角色知道了此事,也证明了“共享信息”的存在。
5)AI具备了定制和修改计划的能力:在模拟结束时,几乎所有的代理人都制定了计划,并且很多因为环境的变化而更改了这些计划。例如,在邀请12个AI参加派对时,只有5个AI出现。其中,有三个AI说自己因为事情太忙而没有去。
该技术有哪些用途
从Generative Agents的模拟实验和技术特性来看,可用于改进大语言模型的输入能力,从而使其长期保持一致性和动态行为,降低危险内容的输出。
应用在庞大的游戏市场,传统游戏的NPC过于死板、套路,无法给玩家新鲜的体验千篇一律。如果引入该技术,可以随着玩家的数据生成出独一无二的NPC个性,增加游戏的整体可玩性和创造性。
本文素材来源斯坦福研究中心,如有侵权请联系删除