人们一开始谈到生成式AI革命的时候,主要的焦点是如何用AI工具提高游戏开发者的效率,即比以前更快、更大规模地制作游戏。不过,人们对于生成式AI所做的探索显然不止于此。
全球知名投资基金A16z分析师认为,虽然生成式AI的确可以提神研发效率,但从长远来看,利用AI的最大机会不仅仅是改变我们打造游戏的方式,还包括游戏本身的性质。
以下是Gamelook编译A16z的全部内容:
我们对生成式AI有机会帮助创造新的AI优先游戏和大幅拓展现有品类感到兴奋。AI长期以来一直在创造新形式玩法方面发挥着重要作用,从(1980年)《Rogue》程序生成的地牢,到(1998年)《半条命》里的有限状态机,再到(2008年)《求生之路》的AI游戏总监。深度学习最新的进展,使得计算机能够根据用户指令和大数据集生成新内容,这进一步改变了游戏。
早些时候,我们看到的一些有趣的AI支持的玩法领域包括生成式代理、个性化、AI叙事、动态世界和AI CoPilot。如果成功,这些系统可以结合起来创造新的AI优先型游戏,以娱乐、吸引并在很长一段时间内留住玩家。
生成式化身(Generative Agents)
1989年Maxis的《模拟城市》开创了模拟游戏品类,玩家们在游戏里建造并管理一个虚拟城市。如今,最受欢迎的模拟游戏是《模拟人生》,全球有7000多万玩家在日常生活中管理那些被称为“sims”的虚拟人。策划Will Wright曾一度将《模拟人生》描述为一间“互动玩偶之家”。
生成式AI可以通过大型语言模型(LLM)提供的即兴社交行为,使得化身更为逼真,从而极大推动模拟品类的发展。
今年早些时候,一个来自斯坦福和谷歌的研究团队发表了一篇关于LLM如何应用于游戏化身的论文。在博士生Joon Sung Park的领导下,研究团队用25个类似《模拟人生》的化身填充了一个像素风沙盒世界,这些代理的行为由ChatGPT和“一种扩展LLM的架构,可以使用自然语言存储化身体验的完整记录,将这些记忆,综合成为更高层次的反射,并对他们动态检索以规划行为。”
结果是未来潜在模拟游戏的迷人预览。从只有一个用户建议化身想举办情人节派对开始,这些化身单独地发出派对邀请,建立新的友谊,约对方约会,并商定在两天后准时一起参加派对。
使这种行为成为可能的是,LLM是根据社交网络的数据进行训练的,因此在他们的模型中,由人类在各种社交环境中如何相互交谈和行为的构成要素。在模拟游戏这样的互动式数字环境中,这些反应可以被触发,创造出令人难以置信的栩栩如生的即兴行为。
从玩家的角度来看,最终的结果是:更具沉浸感的游戏玩法。玩《模拟人生》或殖民地模拟游戏《环世界》的乐趣很大程度上来自于发生的意想不到的事情,以及经历的情绪起伏。由了社交网络文献提供的化身行为,我们可能会看到模拟游戏不仅能反映游戏策划的想象力,还能反映人类社会的不可预测性。观看这些模拟游戏可以作为下一代《楚门的世界》,带来一种在如今预先写好剧本的电视或电影中不可能实现的无尽娱乐。
利用我们对富有想象力的“玩偶之家”玩法的渴望,化身也可以是个性化的。玩家可以根据自己或虚构人物打造一个理想的化身。Ready Player Me允许用户通过自拍生成自己的3D化身,并将其导入超过9000个游戏或应用程序。AI角色平台character.AI、InWorld和Convai能够创建具有自己的背景故事、个性和行为控制的自定义NPC。想创建一个霍格沃茨模拟游戏,让你和哈利波特成为室友吗?现在你可以实现了。
随着他们有了自然语言能力,我们与化身互动的方式也得到了扩展。如今,开发者可以使用Eleven Labs的文本到语音模型为他们的化身生成逼真的声音。Convai最近与英伟达做了一个demo,让玩家与AI拉面厨师NPC进行自然的语音对话,对话和匹配的面部表情都是实时生成。AI伴侣应用Replika已经允许用户通过语音、视频和AR/VR与他们的伴侣交谈。接下来,人们可以想象一款模拟游戏,玩家在旅途中通过电话或视频聊天与化身保持联系,然后回到电脑后点击进入更具沉浸感的玩法。
请注意,在我们看到完整版生成式版本的《模拟人生》之前,还有许多挑战需要解决。LLM在其训练数据中存在固有的偏见,这可能反映在化身的行为中。在云中为全天候在线服务游戏运行大规模模拟的成本在财务上可能行不通,两天内运行25个化身需要花费研究团队数千美元的算力成本,将模型工作量转移到设备上的努力是有希望的,但现在仍然相对较早,我们可能还需要围绕与化身的准社会关系制定新的规范。
然而有一件事很清楚,生成式化身的需求量很大。在我们最近的调研中,61%的游戏工作室计划尝试AI NPC。我们的观点是,随着化身进入我们的日常社交领域,AI伴侣将很快变得司空见惯。模拟游戏提供了一个数字沙盒,我们可以在这里以有趣和不可预测的方式与我们最喜欢的AI同伴互动。从长远来看,模拟游戏的性质可能会发生变化,以反映这些化身不仅仅是玩具,而是潜在的朋友、家人、同事、顾问,甚至恋人。
个性化
个性化游戏的终极目标,是为每一个玩家提供独特的游戏体验。比如,我们从角色创建开始,这几乎是所有RPG游戏的一个核心,包括从最早的《龙与地下城》,到米哈游的《原神》。大部分RPG游戏允许玩家从预设选项定制化外观、性别、职业等等,但是,如果能够超出预设,为每个玩家和每次游戏生产独特的角色会怎样?个将LLM与文生图的扩散模型(如Stable diffusion或Midtravel)相结合的个性化角色构建器可以实现这一点。
Spellbrush的《Arrowmancer》就是由该公司定制化GAN动漫模型支持的一款RPG游戏,《Arrowmancer》里的玩家可以生成一整套独特的动漫角色,包括美术和战斗能力。这种个性化也是其变现系统的一部分,玩家将他们用AI创建的角色导入自定义扭蛋横幅中,在那里他们可以找出重复的角色来增强队伍。
个性化还可以延伸到游戏里的物品。比如,AI可以帮助生成独特的武器和装备,仅提供给完成了特定任务的玩家。Azra Games就打造了一个AI支持的资产管线为游戏内物品和世界物体快速设计概念,为更多差异化的玩法铺平了道路。3A开发者动视暴雪也打造了Blizzard Diffusion,帮助为角色和装备生成各种概念艺术。
游戏里的文字和对话也已适合个性化。游戏世界里的符号可以反映玩家获得了某种头衔或地位(例如,因杀人罪被通缉)。NPC可以被设置为LLM支持的化身,带有截然不同的个性,可以适应你的行为。例如,对话可以根据玩家过去与化身的行为而改变。我们已经在3A游戏中看到了这个概念的成功执行,Monolith的《暗影魔多》有一个复仇系统,可以根据玩家的行为为反派动态创建有趣的背景故事,这些个性化元素使每次体验都独一无二。
游戏发行商育碧最近透露了Ghostwriter,这是一个由LLM支持的对话工具。如今,该发行商的编剧们使用该工具生成背景聊天和吠叫(触发事件期间的对话片段)的初稿,帮助模拟一个玩家周围活生生的世界。通过微调,像Ghostwriter这样的工具有可能用于个性化吠叫。
从玩家角度来看,所有个性化的最终影响是双重的:它增加了游戏的沉浸感和可重复性。《天际线》和《GTA5》等沉浸式开放世界游戏的RPG模组的持续流行表明了对个性化故事的潜在需求。即使在今天,《GTA》RPG服务器里的玩家数量也一直高于原游戏。我们看到了一个未来,个性化系统是一个不可或缺的在线运营工具,可以在所有游戏中长期吸引和留住玩家。
AI叙事故事
当然,一个好的游戏不仅仅是角色和对话。另一个令人兴奋的机会是利用生成式AI讲述更好、更个性化的故事。
游戏中个性化讲故事的鼻祖是《龙与地下城》,一个被称为地下城大师的人准备一个故事,并向一群朋友讲述,每个人都扮演故事中的不同角色。由此产生的叙事部分是即兴剧场,部分是RPG,这意味着每一次游戏都是独一无二的。作为个性化故事讲述需求的一个信号,如今的《龙与地下城》从未像现在这样受欢迎,数字和模拟产品的销售额创下历史新高。
如今,许多公司正在将LLM应用于《龙与地下城》的叙事模型。机会在于让玩家在无限耐心的AI故事讲述者的指导下,在他们喜爱的玩家制作或IP宇宙中度过尽可能多的时间。Latitude的《AI地牢》于2019年推出,是一款开放式、基于文本的冒险游戏,AI扮演地牢主人。用户还对OpenAI的GPT-4版本进行了微调来玩《龙与地下城》,并取得了有希望的结果。Character.AI的文字冒险游戏是该应用最受欢迎的模式之一。
Hidden Door更进一步,在一组特定的源素材上训练其机器学习模型,例如《绿野仙踪》,允许玩家在既定的IP宇宙中冒险。通过这种方式,Hidden Door与IP所有方合作,实现了一种新的、互动的品牌拓展形式。粉丝们每完成一部电影或一本书,就可以通过一场类似《龙与地下城》的定制活动,在他们最喜欢的世界里继续冒险。粉丝体验的需求也在激增,仅在5月份,两个最大的在线粉丝存档库Archiveofourown.org和Wattpad的网站访问量就分别超过3.54亿和1.46亿。
NovelAI研发的自己的LLM Clio,用于在沙盒模式下讲故事,并帮助解决人类作家的写作障碍。对于眼光敏锐的作家来说,NovelAI允许用户根据自己的作品,甚至是像H.P.Lovecraft或Jules Verne这样的著名作家,对Clio进行微调。
值得注意的是,在AI故事制作完全就绪之前,还有许多障碍。开放式AI很容易失控,这使得它很有趣,但对游戏设计来说却很笨拙。今天,要打造一个优秀的AI故事讲述者,需要大量的人类规则设置来定义一个好故事的叙事弧线。记忆和连贯性很重要,讲故事的人需要记住故事早期发生的事情,并在事实和风格上保持一致。对于许多作为黑匣子运行的闭源LLM来说,可解释性仍然是一个挑战,而游戏策划们需要理解为什么一个系统的行为方式来提升游戏体验。
然而,当这些障碍正在被克服的时候,AI作为人类故事讲述者的副手已经成熟。如今,数以百万计的作家使用ChatGPT为自己的故事提供灵感。娱乐工作室Scriptic融合了DALL-E、ChatGPT、Midjourney、Eleven Labs和Runway,以及一个人类编辑团队,来构建互动、个性化的冒险节目,并且已经可以在Netflix上观看。
动态化世界构建
虽然文本为基础的故事很受欢迎,很多玩家还希望看到他们的故事以视觉化形式呈现。游戏里的生成式AI最大的机会,可能就是帮助创造那些让玩家投入无数时间在其中的栩栩如生的世界。
虽然如今还不可行,但一个经常被提及的愿景是,随着玩家在游戏中的进展实时生成关卡和内容。科幻小说《安德的游戏》中的心理游戏(The Mind Game)就是这种游戏的典型例子。心理游戏是一种AI指导的游戏,它实时适应每个学生的兴趣,根据学生的行为和AI可以推断的任何其他心理信息来进化世界。
如今,最接近心理游戏的可能是Valve的《求生之路》系列,该系列利用AI总监来实现动态化的游戏节奏和难度。AI总监没有为敌人(僵尸)设置复活点,而是根据每个玩家的状态、技能和位置将不同数量的僵尸放置在不同的位置,在每次游戏中创造独特的体验。总监还用动态的视觉效果和音乐来设定游戏的气氛(翻译过来就是:超级恐怖!)。Valve创始人Gabe Newell创造了这个系统“程序叙事”。EA广受好评的《死亡空间》重制版使用了AI导演系统的变体,以最大限度地增加恐怖氛围。
虽然这在今天看来可能是属于科幻小说的领域,但有一天,随着生成模型的改进和对足够计算能力和数据量的访问,我们可能会打造一个不仅能生成“跳跃式惊吓”,还能生成恐怖世界本身的AI总监。
值得注意的是,游戏中机器生成关卡的概念并不新鲜。从Supergiant的《黑帝斯》到暴雪的《暗黑破坏神》,再到Mojang的《我的世界》,当今许多爆款游戏都使用程序生成技术,一种关卡随机创建、每次体验都不同,并且使用了人类策划运行的函数和规则的技术。围绕程序化生成已经建立了一个完整的软件库,Unity的SpeedTree帮助开发者生成虚拟树叶,你可能在《阿凡达》中的潘多拉森林或《老头环》的场景中看到过这些树叶。
游戏可以将程序化资产生成器与用户界面中的LLM相结合。《Townscaper》游戏使用一个程序系统,只需要两个玩家输入(方块位置和颜色),就可以实时将它们变成华丽的城镇景观。想象一下,《Townscaper》在用户界面中添加了LLM,通过自然语言提示,帮助玩家迭代获得更细致入微、更美丽的创作。
许多开发者也对利用机器学习增强程序化生成的潜力感到兴奋。有一天,游戏策划可以使用用风格相似的现有关卡训练模型,迭代生成一个可行的关卡初稿。今年早些时候,Shyam Sudhakaran带领哥本哈根大学的一个团队创建了MarioGPT,这是一种GPT2工具,可以使用在《超级马里奥1》和《超级马里奥2》原始关卡上训练的模型生成《超级马里奥》关卡。这方面的学术研究已经有相当长的一段时间,包括2018年的一个旨在使用生成对抗网络(GANs)设计第一人称射击游戏《毁灭战士》关卡的项目。
与程序系统协同工作,生成式模型可以明显加快资产创作。美术师们已经在使用文生图扩散模型来进行AI辅助的概念艺术和故事板。Mainframe VFX负责人Jussi Kemppainen在自己的博客中描述了他在Midjourney和Adobe Firefly的帮助下为2.5D冒险游戏构建世界和角色的过程。
3D生成也得到了大量的研究。Luma使用神经辐射场(NeRF)让消费者能够从iPhone拍摄的2D图像构建逼真的3D资产。Kaedim将AI和人为品质把控相结合,创建了可直接用于制作的3D网格,目前已有超过225名游戏开发者使用。CSM最近发布了一个专有模型,可以从视频和图像中生成3D模型。
从长远来看,更高的目标是使用AI模型进行实时世界构建。我们看到了一个潜在的未来,整个游戏不再渲染,而是在运行时使用神经网络生成。英伟达的DLSS技术已经可以使用消费级GPU动态生成新的更高分辨率游戏帧。总有一天,你可以点击Netflix电影上的“互动”,然后走进这个世界,看到每一个动态生成的场景,并为玩家提供独特的个性化设置。在未来,游戏和电影之间的界限将变得难以区分。
值得注意的是,动态生成的世界本身不足以制作一款好游戏,《无人深空》的滑铁卢就证明了这一点,该游戏发布之后有超过1800万兆颗程序生成的行星。动态世界的承诺在于它和其他游戏系统的结合,比如个性化、生成式化身等等。毕竟,心理游戏最引人注目的部分,是它如何将自己塑造成安德,而不是世界本身。
所有游戏的AI助手(AI Copilot)
虽然我们之前讨论了生成化身在模拟游戏中的使用,但还有另一个即兴用例,即AI充当游戏副手,指导我们的游戏,在某些情况下甚至与我们并肩作战。
AI助手对于让玩家进入复杂的游戏来说可能是非常宝贵的。例如,像《我的世界》、《Roblox》或《Rec Room》这样的UGC沙盒是丰富的环境,如果有合适的材料和技能,玩家几乎可以打造他们想象的任何东西。但这里有一个很高的学习曲线,对大多数玩家来说,想要搞清楚如何开始并不容易。
AI助手可以让任何玩家成为UGC游戏中的大师级建造者,根据文字或图像指令提供循序渐进的引导,并指引玩家克服错误。一个恰当的参考是乐高宇宙中的大师建造者概念,很少有人能够在需要的时间内看到他们可以想象的任何创造的蓝图。
微软已经在为《我的世界》做一个AI助手,它使用了DALL-E和Github CoPilot,让玩家通过自然语言指令将资产和逻辑注入一次《我的世界》游戏中。Roblox也在主动为《Roblox》平台接入生成式AI工具,希望让“每个用户成为创作者”。从使用Github Copilot进行编码到使用ChatGPT写剧本,AI助手在联合创作方面的有效性已经在许多领域得到了证明。
除了共同创作之外,经过人类游戏数据训练的LLM应该能够理解如何在各种游戏里表现。通过适当的整合,当玩家们的朋友不在时,化身可以作为合作伙伴,或者像在《FIFA》或《NBA 2K》等面对面的游戏中占据球场的另一边。这样的化身总是可以游玩,无论输赢都很亲切,从不挑剔。根据我们的个人游戏历史进行微调,该化身可能远远优于现有的机器人,完全按照我们自己的方式或以互补的方式进行游戏。
类似的项目已在受限的环境中成功运行。流行的竞速游戏《Forza》开发了一个Drivatar系统,该系统使用机器学习模拟人类玩家的行为,为他们打造了一个AI驱动程序。Drivatars被上传到云端,当他们的人类伙伴离线时,他们可以被要求与其他玩家比赛,甚至可以获得胜利积分。谷歌DeepMind的AlphaStar根据“长达200年”的《星际争霸II》游戏数据集进行了训练,以创建能够在游戏中玩并击败人类电子竞技职业选手的化身。
AI辅助作为一个游戏机制甚至可以创造全新的玩法模式。想象一下《堡垒之夜》,每个玩家都有一根Master Builder魔杖,可以通过指令即时创造狙击枪或燃烧的巨石。在这种游戏模式下,胜利可能 更多取决于魔杖的作用(指令),而不是枪法瞄准的能力。
完美游戏内AI“伙伴”的梦想,一直是很多热门游戏系列令人印象深刻的部分,比如《光环》宇宙里的科塔娜、《最后幸存者》里的艾莉,或者是《生化危机》中的伊丽莎白。对于竞技游戏,打败电脑机器人从来都不过时,从《太空入侵者》中的“frying aliens”到《星际争霸》中的comp stomp,最终变成了单独的游戏模式“Co-op Commanders”。
随着游戏发展成为下一代社交网络,我们预计AI助手将作为教练和/或伙伴发挥越来越突出的作用。众所周知,添加社交功能可以增加游戏的粘性,有朋友的玩家留存率最高可以高出5倍。我们看到了这样一个未来,每个游戏都有AI助手,遵循“独自一人也能玩的很好,与AI玩更好,与朋友玩体验最佳”的箴言。
总结
我们还处于将生成式AI应用于游戏的早期阶段,在这些想法投入制作之前,许多法律、道德和技术障碍都需要解决。今天,除非开发者能够证明用于训练模型的所有数据的所有权,否则AI生成资产游戏的合法所有权和版权保护在很大程度上尚不清楚。这使得现有IP的所有者很难在其制作管线中使用第三方AI模型。
对于如何补偿培训数据背后的原创编剧、美术师和创作者,也存在重大担忧。挑战在于,如今大多数AI模型都是根据互联网上的公共数据进行训练的,其中大部分都是受版权保护的作品。在某些情况下,用户甚至可以使用生成模型来重现具体某个艺术家的风格。现在还为时过早,内容创作者的补偿需要适当解决。
最后,当今大多数生成模型在云计算中以现代游戏运营所需的全天候全球规模运行,成本都是非常高的。为了经济高效地规模化,应用程序开发者可能需要找到将模型工作负载转移到用户终端设备的方法,但这需要时间。
然而,目前显而易见的是,开发者和玩家对游戏生成式AI有着巨大的兴趣。虽然也有很多的炒作成分在内,但我们对在这个领域看到的许多才华横溢的团队感到非常兴奋,他们在加班加点地打造创新的产品和体验。
机会不仅在于让现有游戏更快、更便宜,还在于解锁一种以前不可能的AI优先游戏。我们不知道这些游戏会呈现什么样的形态,但我们知道游戏行业的历史一直是技术驱动新的游玩形式。潜在的奖励是巨大的,随着生成式化身、个性化、AI叙事、动态世界构建和AI助手等系统的出现,我们可能即将看到第一批由AI优先开发者打造的第一批永无止尽的游戏。