图源《最后生还者》PlayStation官方商城
在AI浪潮涌向游戏之后,作为玩家的伙伴/伴侣,NPC(Non-player character,非玩家角色)的戏份正在变得越来越多。
在生成式AI技术的加持下,游戏NPC正在通过其背后决策模型与认知模型的相互训练,而逐渐变得拟人化。现如今,玩家在与NPC的交互过程中,得到的回应已不再只是预设好的固定文本与动作,而是有情绪与思考的真切反馈。
钛媒体APP发现,目前游戏NPC的迭代大致可以为三个阶段。以有限状态机与行为树为主的脚本型NPC,和以大数据与深度学习为主的竞技型NPC,以及以生成式AI技术为主的拟人型NPC。
凭借多任务大模型等技术的加持,拟人型NPC在储存信息并进行概率预测的基础上,开始试着学习与理解现实世界中的基础常识与对错概念。
在过往科幻类影视作品的影响下,人们或多或少地期待着自己的身边能够拥有一个类似于“贾维斯”(《钢铁侠》里主角的AI助手)的存在,而现如今随着AI技术在游戏领域应用的不断深入,在游戏世界里,这一目标似乎已不再遥远。
脚本型NPC,设计充满套路感
目前业内比较认可的首位游戏NPC,是来自上世纪40年代的Nimatron。它搭载于同名的电机设备之上,该设备首次对外亮相于1939年纽约世界博览会。玩家可以通过操作机器上的按钮,来与机器进行一场尼姆游戏对决。
尼姆游戏是由美国数学家查尔斯·伦纳德·布顿(Charles Leonard Bouton)总结归纳出的数学策略游戏。游戏参与者需轮流从一堆物体中拿走单个或多个物体,拿走最后一个物体的参与者将被判负。
Nimatron虽然没有虚拟形象,也无法发出声音,但是它会根据玩家的操作做出反馈,并且拥有自己专属的行为模式。
后续,随着电子游戏的概念逐渐形成,游戏厂商开始为NPC设计虚拟形象。在此期间,比较知名的游戏NPC是由日本游戏厂商南梦宫(Namco)开发的《吃豆人》(Pac-Man)。玩家在游戏中需要在躲避四位NPC追捕的同时,吃掉游戏场景中的所有豆子。
图源《吃豆人》Google Play官方商城
有趣的是,《吃豆人》的开发者为四位NPC设置了各不相同的行动模式。游戏中,红色的NPC会尾随玩家,粉红色与浅蓝色的NPC则根据玩家的前进方向进行围堵,蓝色的NPC在到达玩家一定范围内后会主动远离玩家。
上述设计的存在,为游戏充分营造出压迫感的同时,也给予玩家一定的喘息空间,从而给玩家带来继续体验游戏的动力。
在脚本式NPC阶段,游戏开发者在开发NPC这件事上,主要采用的技术是有限状态机与行为树。
有限状态机的英文全称为Finite-state machine,这是一种表示在状态数量有限的前提下,程序在状态之间转移并发生相应行为的数学计算模型。
比如,一位NPC在初始状态下被设定的行为是在规定范围内巡逻,而当玩家走近到一定范围内后,NPC会攻击玩家,NPC血量下降到一定阶段后,其可能会逃跑求援或释放伤害数值更高的技能。
相较之下,行为树的运行原理与有限状态机十分相似,但结构更加复杂。程序的每一道指令都会从行为树的根节点出发,然后根据子节点的属性来决定状态的切换路径和最终执行的实际行动。
这套体系中有三个比较重要的概念点,条件节点、动作节点以及并行节点。前两种节点基本对应状态的切换与执行结果,而并行节点在触发时,其下属的所有子节点都会平行执行。比如,游戏Boss在濒死状态会同时释放大范围AOE技能与近距离的非指向性技能(即向指定对象输出的技能)。
当然,无论是有限状态机,还是行为树,这两种开发技术都存在着无法解决的底层缺陷,即缺乏成长性与随机性。
脚本式NPC最大的缺陷在于,在游戏开发过程中,无论是游戏开发者的想象力,还是程序开发的复杂结构,它们都是相对有限的。因此,所有脚本式NPC的行为都是有规律的,玩家在摸清NPC的行为规律后就可从中获益。
比如,在《英雄联盟》中,玩家可以通过判断野怪(地图中立NPC)对玩家的仇恨值上限,来使自己对野怪造成伤害的同时减少野怪对自己的伤害。
竞技型NPC,能掐会算但不懂人情
后来,随着深度学习与大数据等概念的兴起,在2010年之后兴起的AI发展过程中,专注于竞技领域的初代AI NPC开始诞生。
起初,这类NPC主要被应用于棋类领域,比较典型的代表有DeepMind研发的AlphaGo。该程序通过将蒙特卡洛树搜索与两个深度神经网络相结合,一方面借助估值网络来评估棋子落点的同时,另一方面则利用走棋网络来决定落子。在2015年到2017年期间,AlphaGo先后击败李世石与柯洁等多位世界顶尖围棋选手。
在棋类领域登峰造极之后,各大AI厂商开始将竞技类电子游戏视为这类NPC的全新应用场景。
无论是国际象棋还是围棋,其本质都是完全信息博弈游戏,有着固定的行数、列数以及棋子数量。在AlphaGo眼中,围棋的信息基本只分为三类——落黑子、落白子、尚未落子,因此变量相对有限。
相较之下,竞技类电子游戏的复杂程度要高出棋类许多。以“DOTA2”为例,“地图迷雾”机制的存在,让NPC只能获取到自身周围的部分环境信息,另外游戏中还存在着生命值、野怪、小兵等多项机制。
在具体的游戏对局中,AI NPC需要在短时间内处理多项决策。比如,当敌我双方进入战斗状态后,AI NPC需要一边移动,一边观察对手的位置与敌我小兵的血量以及自身生命值与法力值(释放技能的前置条件之一)的储备情况,从而决定自己的攻击对象是对手还是小兵(注:击杀对手小兵可以获得经验与金钱,而击杀己方小兵则可阻止对手获取该部分收益)。
在竞技类电子游戏领域中,比较知名的AI NPC有OpenAI研发的“DOTA2” AI NPC——Open AI Five。
OpenAI Five首次亮相于2017年DOTA2国际邀请赛,在这场代表着DOTA2全球竞技水平最高的赛事上,OpenAI Five曾与该项目顶级职业电竞选手Dendi进行1v1对决并取胜。
OpenAI Five亮相DOTA2国际邀请赛,图源OpenAI官网
后续在持续的强化学习下,OpenAI Five的对战能力从1v1进化到5v5,并于2019年4月的一场公开比赛上成功击败2018年DOTA2国际邀请赛冠军OG战队。另外,在击败OG的同一个月,OpenAI Five与DOTA2玩家进行了超过4万场对局,胜率高达99.4%。
OpenAI之所以会选择在“DOTA2”这样的电子游戏中训练AI,一定程度上是因为在这样复杂的游戏环境中研究机器学习,将帮助他们更准确地感知现实世界中的不可预测性与连续性,从而构建更为通用的问题解决系统。
在2023年的一场公开活动中,OpenAI联合创始人伊利亚·苏茨克维尔(llya Sutskever)在与英伟达(Nvidia)创始人黄仁勋的对话中透露,“GPT从DOTA2的强化学习中奠定了技术基础。”
拟人型NPC,反倒让玩家当了狗?
如今随着生成式AI技术的发展,AI NPC开始被应用到更多的游戏品类之中,并为玩家带来创新游戏体验。
去年6月30日,网易旗下高举“AI游戏”大旗的角色扮演类(RPG)游戏《逆水寒手游》正式上线。基于网易伏羲AI引擎,大量AI玩法应用于游戏之中,为玩家带来了更具沉浸感的互动体验。
《逆水寒手游》中,数百位经过训练的AI NPC遍布游戏世界各地,他们拥有独立的性格、情绪、记忆以及行为模式,会根据玩家的交互行为做出符合自己“人设”的反馈。游戏上线后,许多玩家纷纷开始与NPC聊天互动,并将互动过程录制后分享至各大游戏社区与论坛上。
有些爱搞怪的玩家在游戏里向NPC提问:“你能当我的狗吗?”,有些NPC秉承一颗高洁之心,选择誓死不从;有些NPC为了讨口饭吃,答应得十分干脆; 而个别口才了得的NPC则上演了一出“反客为主”,一番争辩下来,玩家反倒成了NPC的狗。
过往同类游戏中,基于脚本生成的NPC普遍只能与玩家进行重复且枯燥的对话与行动。而如今,随着AI技术的应用,玩家的游戏体验边界开始被打破,技术上的突破最终也的确落实到《逆水寒手游》上线后的各项运营数据之上。
今年春节假期期间,《逆水寒手游》多日登上iOS国区畅销榜前十,网易官方也在近日公布的2023年Q4及全年财报上肯定了这一游戏上线后的优秀表现与对游戏业务收入的贡献。
图源《逆水寒手游》官网
现如今,AI NPC之所以能够更加拟人化,这一定程度上是因为如今AI NPC在基于多任务模型所构成的AI引擎的训练中,加入了大量对现实世界常识与物理信息的学习和感知。
以超参数科技研发的AI技术系统GAEA为例,该系统下分两大子系统——灵魂系统与环境系统。灵魂系统像是AI NPC的大脑,环境系统则像AI NPC的感官。
灵魂系统共分为记忆与策略两部分。记忆部分由内部状态和事件经历组成,内部状态与NPC行为模式相关,该部分会设置多项数值,比如“心情值”、“财富值”、“好奇心值”等等,NPC的行为会根据数值的变化而改变。事件经历则负责记录NPC所参与和观察的游戏事件,从而为NPC行为决策提供参考。
策略部分则由宏观决策模型与交互模型组成。决策模型会根据记忆和NPC所处环境来制定整体大致决策方向,而决策的拆解与细节上的把控则由交互模型来完成,并最终落实到NPC的具体行动之中。
环境系统分为社会环境和物理环境两部分。社会环境涵盖AI NPC之间交互后得到的行为信息与现实社会常识,比如,人们做饭要买菜,买菜要花钱等等。物理环境则更多指的是游戏场景中的各种物理数据,包含各类建模的具体数据,从而引导NPC合理地进行行动。
乍一听之下,AI NPC后续的迭代方式似乎已十分清晰,但在具体落地的过程中,却依旧存在着各种困难。
诸多难点中,NPC的长期记忆能力差是一个被讨论次数比较多的问题。在《逆水寒手游》中,有的玩家上线后发现,自己之前培养过感情的NPC如今却忘记了这段经历。这种现象的出现,一定程度上与NPC的长期记忆能力有关。
理论上来说,经过AI训练的NPC的记忆能力非常强。但是人与人之间通过交互所产生的个体记忆,与大模型的记忆能力是两个概念。如果把NPC的大脑比作知识的海洋,那么NPC长期记住与玩家的交互经历就相当于NPC每时每刻都能在波涛汹涌的海面上捞出同一根针。
因此如若要改善NPC在长期记忆上的短板,那么或许需要进行更多的应用技术开发,从而解决大模型运行方式和人类常理之间的差异。
NPC从来都不只是玩家的工具
在NPC的迭代过程中,NPC在游戏中所扮演的玩家伙伴/伴侣的角色,正在变得愈发明显。
本世纪初,由知名游戏设计师上田文人所创作的解谜游戏《古堡谜踪》(ICO)曾让一代玩家逐渐意识到NPC的陪伴价值。
游戏中,被囚禁于古堡的主角在逃离途中遇到被视作祭品的女孩Yorda,于是两人携手开启逃离古堡的冒险旅程。途中遇到敌人时,玩家扮演的主角在牵起Yorda的手后即可得到能力加持,并且手柄端的震动反馈也会让玩家在体感上进一步意识到与Yorda的连接。
牵手机制的存在,为玩家架起了与游戏进行情感连接的桥梁。(牵手)它可以代表勇气,也可以代表友谊,还可以代表爱怜。玩家在向游戏投射复杂且多元的情感同时,也让自己对这款游戏有了更为沉浸且丰富的感知。
到了2010年之后,由顽皮狗制作开发的《最后生还者》(The Last of US)系列更是将NPC在游戏内的价值推到了新的高度。
《最后生还者》系列以病毒丧尸为主题,故事构建在架空背景的北美大陆上。该系列共有两部作品,第一部作品以中年男性乔尔为主视角,讲述了乔尔与免疫病毒的少女艾莉,在共同前往病毒疫苗研制中心的路上所发生的一系列冒险故事。
第一部作品中,身为走私客的乔尔接到护送艾莉的任务委派,在因任务而被病毒感染的搭档泰丝的央求下,乔尔决定完成此次任务,并以此寻求彻底解决病毒危机的希望。
在乔尔成为走私客之前,他与家人在逃离病毒途中遭遇车祸,女儿莎拉受伤后被士兵误认为是感染者而遭枪杀。之后,成为走私客的乔尔每日借酒浇愁,苟活于世。
对于乔尔而言,一开始决定护送艾莉或许只是因为搭档的临终请求,但后来随着两人数次死里逃生后,这位与女儿生前年龄相近的少女,逐渐成为了乔尔的情感寄托与生存动力。
这种情感上的纠葛,让乔尔在得知被护送到目的地的艾莉会因研发疫苗而丧命时,毅然决定杀光所有相关医务人员并带着艾莉另谋活路。
医务人员的死亡宣告着疫苗研制的彻底失败,整个世界也将因此继续沉沦在病毒带来的痛苦之中。而这段大叔与萝莉救赎彼此的故事,最终则以乔尔独自背负罪孽而告一段落。
图源《最后生还者2》PlayStation官方商城
到了第二部作品,苏醒后的艾莉逐渐得知乔尔为救自己而杀戮无辜的事实真相,这让她一时间难以接受,作为拯救世界的希望,艾莉之前在冒险途中切身感受到病毒对人类乃至整个世界的颠覆,现如今因乔尔的一己私欲,导致自己没能拯救世界,这份罪恶感让她对乔尔开始心生芥蒂。
在这份情感冲突爆发的同时,被乔尔杀死的医生后代艾比前来复仇,并当着艾莉的面将乔尔虐杀,故事的主题就此从“生存与希望”转变为“复仇的起点与终点”。艾莉将艾比的好友近乎屠戮一空,包括已怀有身孕的梅尔。而在艾比的还击下,艾莉的身边也只剩下女友蒂娜和乔尔的弟弟汤米。
因为心中对乔尔离世的歉疚与愤怒,沉浸于复仇梦魇的艾莉始终没有放弃对艾比的寻找,但在艾莉成功寻到艾比并即将大仇得报之时,艾比身边那位名为勒弗的小孩让她想起了乔尔与自己。在那一刻,艾莉选择原谅艾比,也与自己达成了和解。
《最后生还者》两部作品的叙事重心,一直是在社会秩序崩坏的大环境下,体现出人性的复杂。如果说,艾莉在第一部作品中的存在,让这个游戏讲述了一个不错的美式公路片故事,那么艾比在第二部作品中的加入,则在让游戏剧情更具深度的同时,也让艾莉的人物形象从趋于工具化的病毒抗体,变成会在末日中学会思考与成长的“活人”。
在科幻电影《失控玩家》中,仅凭由“小贱贱”瑞安·雷诺兹主演的主角一人的意识觉醒,影片中古板腐朽的游戏世界就被搅得天翻地覆。那么设想一下,假如未来的游戏世界里,每一位NPC的复杂程度都像《最后生还者2》通关后的艾莉那样,那么这样的游戏和现实世界之间,还会存在多少差距呢?
(本文首发钛媒体APP,作者|吴一枭,编辑|李程程)