当前位置:首页|资讯|AIGC|元宇宙|融资

AIGC行业报告:通往元宇宙无尽游戏之路

作者:新浪VR发布时间:2023-09-12

AIGC行业报告:通往元宇宙无尽游戏之路

  (报告出品方/作者:国盛证券,宋嘉吉、金郁欣)

  投资分析

  自我们 2022 年 10 月份首发深度报告《AIGC——Web3 时代的生产力工具》后,科技板 块因 AGI 的技术突破而成为市场焦点。经过了一季度的火热行情后,我们在思考:当前 市场的预期到了什么位置?未来会如何演绎?或者说把时间再放长一点,还有哪些新应 用、新爆款?

  未来的预期差:

  (1)市场皆知 AIGC 空间广阔,但低估了幅度和广度。经过一个季度的学习与体验, 市场开始认识到 ChatGPT、Midjourney 等产品的爆发力,而微软的产品发布也让大家看 到在工具型应用上的潜力。而我们认为,AGI 的迭代速度会远超市场预期,至少对 C 端 的赋能还未完全体现。当 AIGC 将内容创作壁垒大幅降低的时候,Z 世代将真正成为数字 世界的原住民。AIGC 是一种生产力工具,更创造了一种生活方式,正如当年互联网所带 给我们这代人的变化一样。正如近期同产业交流时所提及,专家担心社会是否真正为如 此巨大的变化做好准备?

  (2)市场认可 AIGC+游戏逻辑,却低估了元宇宙的愿景。路演中大家认可 AIGC 对游 戏行业的降本,但忽略了玩法创新。AIGC 因为有产品、有用户,市场都认为它比元宇宙 靠谱,但我们认为,元宇宙本身就是长期愿景,这一愿景如今依然存在,而 AIGC 是连 接这一数字愿景的良机。在 AIGC 的助力下,用户可以以“上帝视角”扮演不同角色穿 越于各个场景中,而 AIGC 将是重要工具,这一理念已经在斯坦福大学和谷歌联合发表 的一篇名叫《GenerativeAgents:Interative Simulacra of Human Behavior》论文中被阐 述,或许这正是开启元宇宙的另一重序曲。

  (3)市场皆知算力重要,但忽略了算力架构的变化。当下市场认为算力生意是“卖铲 子”,市场聚焦了两条主线,一是和海外业务关联度较高的,如光模块、服务器等;另一 个是国产化,如 GPU 芯片等,上述也当仁不让地成为了市场主线。未来,随着大模型基 础设施的完善,应用会越来越丰富,算力将更多呈现为“中心——边缘——终端”的分 层布局,这种架构的变化有望更多被挖掘。同时,涉及算力的新材料、新技术、新方案 在此前看来尚未成熟,但在 AI 大算力的驱动下,处于功耗比、通信容量的要求,也会凸 显价值。

  AIGC+“游戏”——不仅仅是降本

  站在 AIGC 应用的角度,我们首先将目光投向“游戏”,之所以打引号,是因为我们讨论 的游戏并不仅仅是娱乐,未来更将是融入学习、社交、创作、分享的元宇宙。登陆这一 赛博空间,可能是一天工作、学习的开始。正如 20 多年前,我们提到“去上网”大概 率是去网吧打游戏,而现在“去上网”却往往是一天工作的开始。之所以重视游戏,一 是因为 AIGC 对数字世界的冲击和迭代更快;二是游戏这一模式更容易被 Z 世代接受, 而 AIGC 对数字原住民的影响会更大。我们认为,AIGC 通过全方位降本,将大幅降低用 户在“游戏”世界中的创作壁垒,从来带来内容的大爆发。

  必须直面的挑战:游戏研发成本增速飞快

  传统游戏产业面临高效率、高质量和低成本的“不可能三角”,即在高效率完成一个高质 量游戏的研发时,想要做到低成本是不可能的。首先,电子游戏自上世纪 70 年代出现 以来,在短短 50 年间经历了街机、掌机、PC 机、主机、VR 等 9 代游戏机,发展出了动 作游戏、角色扮演、模拟游戏、战略游戏、射击游戏等十多种游戏大类,近四十种游戏 小类。游戏模式的迭代速度是一个极快的过程,只有极少数游戏能活跃 2 年以上,大部 分游戏甚至是大部分爆款游戏也只能维持半年到一年的时间,2022 年爆火的羊了个羊就 是一个例子。所以,游戏企业需要保持对于游戏玩法的创新和对于市场消费者的感知, 高效率开发游戏产品。

  其次,一个典型的游戏开发团队主要有三种职位:策划、美工和程序,这三大工种之下 可以分为文案、数值、关卡、2D、3D、角色、场景、音频、测试等 20 个职能。游戏作 为一个注重用户体验的产品,需要将目光聚焦在产品、内容的丰富程度,而在完善内容 的丰富度、拓展游戏的开放性的过程中,需要策划、美工等职位的相互协调和在游戏质 量上的大量投入。所以,对于传统游戏行业,在必须兼顾高效率与高质量的条件下,高 成本也不可避免。

  高成本只是其一,成本上涨速度快才是关键。2010 年发布的互动类电影游戏《暴雨 (Heavy Rain)》引起了极大轰动,其制作成本约为 2100 万美元;而 2020 年发布的开 放世界角色扮演游戏《原神》制作成本约为 3-5 亿美元。2018 年,中国市值 Top10 游戏企业用于游戏研发的合计费用约为 178.03 亿元;2022 年,这个数字预计将上涨至 383.76 亿元。在短短 5 年的时间里,Top10 游戏企业用于游戏研发的费用提升了一倍有余,除 了 2022 年,每年的费用增长率都在 20%以上。

  如此高且增长迅速的游戏研发成本主要分为四大部分:游戏数值平衡设计、游戏素材设 计、游戏剧情设计和程序设计。

  游戏数值平衡设计:数值体系的构建在游戏的战斗系统、经济系统等多个领域均有 涉及,是游戏设计中的重要部分,是游戏体验的核心驱动力。站在玩家角度,一方 面玩家希望能够通过游戏操作为自己带来优势,一方面也希望减小玩家间基本数值 上的过大差距;一方面希望“氪金”能为自己带来更好得游戏体验,一方面也希望 “肝”不会比“氪金”差多少。企业要想实现这些目标,就需要在游戏开发时或运 营中对各种数值进行数值拆解、数值分析、数值设计、数值测试等多种数值调整流 程。以游戏英雄联盟为例,游戏中有上百个英雄人物,上百种可使用的装备,每年 平均有一个大版本的数值更新和十几个小版本的数值更新,无疑要花费大量人力资 源。

  游戏素材设计:游戏素材包括音频音效,也包括 UI、场景、角色、道具、特效等 2D 或 3D 素材,其效果是玩家对游戏的“第一印象”。以制作一个次世代 3D 游戏的 角色为例,其制作流程通常分为六个步骤:概念设定、模型搭建、贴图烘焙、骨骼 蒙皮、动画制作和引擎测试,不仅需要原画师设计角色原画,还需要模型师进行角 色模型制作,并在模型的基础上完成贴图,最后由动画师按照游戏要求完成动画制 作。这样繁琐的工作导致一个完整的 3D 角色的制作周期大概在 30-45 天左右。

  游戏剧情设计:游戏剧情是游戏的内核,也是游戏的“灵魂”。游戏剧本的创作流 程通常划分为策划和剧本创作两个阶段。在策划阶段需要确定游戏主题、故事、角 色、世界观等内容;在剧本创作阶段,需要编写剧本、制作剧情动画等。剧情设计 的目标在于将游戏的故事情节、人物角色和场景等元素融合在一起,让玩家在游戏 过程中感受到游戏故事的情感氛围,也正由于游戏剧情是基于玩家对于角色的操作 和行动带来的,其带给玩家的代入感也远超其他艺术载体。一个好的游戏剧情能让 玩家接受像素级的画面设计,而游戏剧情设计的难点也在于想象力与创造力——如何创造出一个引人入胜的故事。

  程序设计:程序设计是实现一个游戏的基础。程序设计的主要任务在于根据游戏策 划的需求,编写游戏程序代码并实现游戏的各种功能。游戏程序开发的难点在于其 涉及面十分广泛,每种游戏类型涉及到数据结构和基础算法等方面都有着大量差异。 另外,游戏引擎的迭代速度相对于其他开发工具要快得多,往往每隔两三年就有较 大的改进和性能提升,因此对于开发者的学习能力要求很高。 总的来说,不论是哪方面,基本都有设计周期长、设计难度大、设计成本高等特点。

  AIGC 赋能游戏,降本只是开始

  既然游戏这一内容创作本身壁垒、成本较高,那 AIGC 最直接的帮助就是降本。AIGC 可 以通过程序化和工业化任务场景美术和建模,帮助游戏开发者提高游戏生产效率。与此 同时,还有望帮助缩短游戏开发周期,创造全新玩法和体验,使精品化游戏的供给大幅 增长,并带来游戏内容质量的变革式提升。最重要的是,AIGC 打破了传统游戏产业的“不 可能三角”,使得高效率、高质量和低成本得以同时存在。

  AI 赋能游戏数值平衡设计

  以多人在线战术竞技游戏(MOBA)为例,这是一种即时战略游戏。每个玩家会操纵一 个具有一系列独特能力的角色,通过联合队友摧毁对手方主要建筑而获得胜利。基于其 即时战略的特点,MOBA 游戏玩法强调玩家的游戏操作,这也意味着游戏角色不能是游 戏胜利的决定因素——每个角色的胜率尽可能稳定在 50%,于是数值平衡就变得十分重 要。但是,MOBA 的游戏环境十分复杂,地图设计、游戏角色属性、游戏道具属性等众 多因素都可能影响到最终的游戏平衡,这导致游戏数值的调整十分困难。 早在 2021 年 7 月,腾讯“王者绝悟”就亮相 2021 年世界人工智能大会,该产品由腾讯 AI Lab 与《王者荣耀》联合推出,展示了人工智能在辅助游戏数值设计上的可能性。

  《王者荣耀》作为一款 MOBA 类型手游,复杂程度不低于 PC 机上的 MOBA 游戏,根据 腾讯 AI Lab,《王者荣耀》对局中面临策略规划、目标选择、技能应用、路径探索等大 量即时选择,其操作可能性预计高达 10 的 20000 次方。面对这样的复杂游戏环境,绝 悟 AI 使用了监督学习和强化学习的技术,通过监督学习模拟不同级别、不同水平的目标 行为,做到了很好的拟人化;通过强化学习构建奖励和惩罚机制,优化 AI 行为逻辑,进而探索出新的游戏策略。

  AI 赋能游戏素材设计

  2022 年 8 月,Stability AI 推出了用于文本生成图像的深度学习模型 Stable Diffusion, 这一模型和之前的生成对抗网络等不同,生成方式复刻了人类的思维模式。其大幅降低 训练和采样阶段的计算复杂度,让文生图的任务能够在消费级 GPU 上快速完成,大大降 低了落地门槛。另外,由于 Stable Diffusion 在 Github 平台上完全开源,企业完全可以 根据 Stable Diffusion 训练部署适合企业自身的模型,满足长尾需求。2023 年 3 月, Midjourney 发布 v5 版本,不仅绘图更逼真,prompt 更灵敏,更是解决了 AI 一直被诟 病的“不会画手指”问题。可以想象,在类似 AI 绘图工具的帮助下,不论是角色的原画 设计,还是场景概念图的设计,这些本需要一周甚至数周才能完成的工作可能会在数小 时内完成,极大提升游戏素材设计效率。

  2023 年 3 月,Epic 在 GDC(游戏开发者大会)上推出了新的面部动画工具 MetaHuman Animator,可以仅通过 Iphone 拍摄的视频来创建逼真的面部动画。在大会的演示中, 演员对着 Iphone 的前置摄像头进行一段 10 秒的讲话,配合对应的面部动作。开发人员 当场演示通过 MetaHuman Animator 工具,在建模人脸上精准复现了这一段讲话视频, 所有面部细节都被高度还原,语言发音与动作细节配合完美,而这花费的整体用时仅仅 为 2 分钟。

  2023 年 3 月,腾讯 AI Lab 在 GDC 上提出了 3D 虚拟场景自动生成解决方案,能够帮助 游戏开发者以更低成本创造风格多样、贴近现实的虚拟城市,提升 3D 虚拟场景的生产 效率。其中重点分享了城市布局生成、建筑外观生成和室内映射生成三大能力。整个路 网生成和微调过程仅需要不到 30 分钟,相比手动设计效率提升近 100 倍;而单个独特 建筑的制作时间也降低至 17.5 分钟,大大提升了场景制作的效率。

  除了画面,AIGC 也能提供音频素材的生成。米哈游逆熵 AI 帮助游戏《未定事件簿》中 的角色配音,可以通过分析文本语境进而完成对声音、语气的改变。昆仑万维旗下的 StarXMusicX Lab 实现了歌曲的 AI 生成,目前已在 QQ 音乐、Spotify 等各大音乐平台发 布了十余首音乐作品。

  AIGC 赋能游戏剧情设计

  剧情设计的关键在于让玩家沉浸入游戏世界,并让玩家意识到游戏世界似乎存在于他们 的行动之外。以《荒野大镖客 2》为例,每个 NPC 都拥有属于自己的生活,NPC 之间会 进行对话和互动。但是,这需要游戏策划者付出大量时间,也需要极强的创造能力—— 以至于能创造一整个世界。AIGC 技术能够帮助策划者解决部分问题,让开发者将更多精 力放在剧情设计的重点——创造性工作上,进而提高游戏整体质量。 育碧于 GDC2023 上发布了文案生成工具 Ghostwriter,它可以帮助文案策划生成 NPC 对 白的草稿版本。具体使用流程是设计师首先创造一个角色,输入角色要经历的“事件或 情况”,选取人物性格、输出方式与输出风格后,Ghostwriter 将按照选取的限制条件生 成多个版本的对白文字,供设计师选择、修改和完善。显然,Ghostwriter 能够帮助游戏 策划更快地完成对话创作,提高创作效率。

  AIGC 赋能程序设计

  AIGC可以帮助开发者以自动化的方式生成游戏程序。目前,基于OpenAI Codex的Github Copilot 可以辅助代码编写,开发者只需要在代码编辑器中安装 Github Copilot 即可使用。 另外,集成了 OpenAI GPT-4 的代码编辑器 Cursor 也已经发布,Cursor 支持 Python、Java、 C/Cpp、JS 等多种语言,可以之间使用自然语言生成代码,在极大程度上减轻了程序设 计的负担并提升其效率。 整体而言,AIGC 带来的游戏制作降本只是第一步,如果一项技术只能用于降本,那想象 力是有限的。最近在和产业交流中,我们发现降本的另一层理解是降低创作壁垒,赋能 有创意的个人也能完成“大制作”。其中的一个案例是此前豆瓣评分高达 9.3 分的水墨国 漫大作《雾山五行》,该制作团队仅 6 人,核心成员林魂身兼出品人、编剧、监督、作画 监督、导演、上色、场景、演唱,这一方面反映出国漫的困境,另一方面也证明了团队 出众的能力和构思。未来如果能有 AIGC 的相助,一人一部剧的时代或许不远了。

  部分投资者担心,AIGC 的赋能会降低游戏创作壁垒,但我们认为,游戏本身是供给创造 需求,有更多创意才能刺激用户消费,才能占据更多用户时间。这种变化正如当年从 PGC 到 UGC 的升级,在上一波短视频兴起之前,用户可能也很难想象视频行业能衍生出如此 众多的商业模式。因此,我们可以简单归纳下逻辑:AIGC→创作壁垒降低→内容爆发→ 流量增长→新科技浪潮。

  AIGC——通往元宇宙无尽游戏之路

  高昂的开发成本给游戏创新带来了风险。这也是为何游戏产业大厂陷入了经典 IP 的“舒 适区”,游戏同质化严重。例如,传统游戏大厂 EA 和育碧醉心于基于经典 IP 开发“年 货”,每部作品大同小异,甚至看不出改进。 EA 旗下的 FIFA 系列游戏从 1994 年到 2023 年每年发布一个版本,但相邻两个版本 之间的改进基本都很少,更多是画质的提升和球员数值的改变。 育碧旗下的刺客信条系列游戏自 2007 年发布以来几乎每年更新一个版本,而玩法 核心也几乎没有改动。 曾以创新闻名的暴雪公司也已经多年没有开发新的 IP。根据暴雪公司官网,其开发 的最新的 IP 是 2016 年发布的《守望先锋》,距今也已经接近 7 年之久。

  与此同时,由于许多小型游戏开发工作室不想承担游戏失败的风险,游戏产业也存在“大 厂创新+工作室模仿”的工作模式,这也使得游戏同质化的进一步加剧。 在此背景下,游戏玩法上的创新就显得极为重要。一方面,从产品角度来看,只有差异 化的产品才能提供超额收益;另一方面,从玩家体验角度来看,许多玩家已经出现了对 同质化产品的“抵抗力”,甚至在游玩过程中会出现疲惫感,所以游戏玩法上的创新亟待 出现。 我们认为,作为目前主流游戏形式之一的开放世界游戏,依旧会是未来游戏形式的主要 组成部分,并且其将在游戏玩法的创新上扮演十分重要的角色。这是因为开放世界中“自 由”的体验更能让玩家沉浸于游戏世界,而开放世界的“包容性”也使得其能容纳更多 游戏玩法,并承载游戏玩法的创新。

  AIGC 赋能四大创新方向

  相比于 AIGC 对游戏的降本,我们更关心“游戏”的创新,这将是未来通往元宇宙之路。 当下游戏创新目前存在两大主要困难: 创新成本高,开发新游戏概念和新游戏机制需要投入大量时间和金钱。 用户接受度难以预料,新的游戏创意和机制是否会被用户接受和喜爱是个未知。 若新游戏开发失败,会造成较大损失。随着 AIGC 时代的到来,游戏开发的成本有望被 大幅度降低,也将进一步导致游戏厂商对新型游戏的试错风险大幅降低。不仅如此,NLP 的迅速发展使得人机交互性提升,为游戏玩法提供新的创新方向。

  智能 NPC——《失控玩家》不再遥远

  智能 NPC 指在游戏中由人工智能驱动的非玩家角色,它们会表现出一定的智能行为,例 如: 自主行动:不经过玩家控制而可以根据环境和情况自主选择行动。 互动和对话:可以与玩家或其他 NPC 进行简单的互动和对话,通过其内置的人工智 能模型完成恰当的响应。 学习和适应:一些更高级的智能 NPC 可以根据与玩家或环境的互动完成学习和适应工作,可以学习玩家的喜好和行为习惯进而变换自己的行为,或根据环境变化调整 自己的行为。 个性和情感:智能 NPC 还可以表现出丰富的个性特征和情感反应。

  2023 年 1 月,游戏公司 Cyber Manufacture Co。发布了新型 AIGC 引擎 Quantum Engine, 用户可以使用自然语言随意与 NPC 互动,AI 会根据用户的表达,实时生成剧情互动。想 要使用 Quantum Engine,首先需要提供一个剧本,这个剧本可以是真实存在的影视剧 剧本,也可以是用户原创。在输入了剧本后,它会根据剧本内容来跟用户进行角色扮演, 用户可以选择键入文字也可以选择直接语音交流,Quantum Engine 的回答会随着用户 表达方式和语气的不同而随机改变,这在剧本推进方面为用户带来了极强的沉浸感。 目前,Quantum Engine 支持中文、英文、日文等多种语言,在一定程度上已经具备了 智能 NPC 的某些特征如能够实时互动与对话,具有自己的个性或情感。虽然 Quantum Engine 目前还无法支持自主生成智能 NPC 的动作,在使用时也可能出现一些错误,但它 已经为智能 NPC 的出现打下了良好的基础。

  非线性游戏——自由世界、随机之美

  非线性游戏是一个相对于线性游戏的概念,区别主要在于游戏情节和体验的灵活性。

  对于线性游戏,其游戏情节和体验是固定的,玩家需要按照设定好的路线和步骤来 推进游戏而不能自由选择不同路径,这导致游戏体验是高度统一的,所以玩家游玩 的动力不足,游戏寿命也较短。

  非线性游戏的游戏情节和体验非常灵活开放,玩家可以自由选择不同的行动路径和选项,创造出自己独特的游戏体验。除此之外,非线性游戏通常是开放式结局或没 有明确结局,玩家完全可以自由探索游戏世界,与各元素互动而没有固定的终点要 达到。这导致了非线性游戏的可玩性更高,也更具沉浸感和自由感,让玩家可以体 验属于自己的游戏世界和游戏故事。

  传统的非线性游戏开发往往需要设计大量的选项及其对应结果,工作量极为庞大。以《荒 野大镖客 2》为例,其在官网上公布的致谢名单中显示参与游戏制作的人数超过了 3000 人,是一个极其繁杂的工作。AIGC 可以帮助解决这一点: 通过先进的人工智能算法,智能 NPC 可以根据玩家的选择和互动作出随意的反应和 决定,主动推进情节发展。 智能算法还可以动态分析玩家的行为,动态生成新的情节、选项及结果,让游戏可 以实现真正的“非线性扩展”,真正实现“千人千面”的游戏效果。 微软的《模拟飞行》,是一款高度真实的飞行模拟游戏,AI 技术的应用主要体现在以下 几个方面: 地形和建筑物生成:游戏利用 AI 技术对全球 15 亿座建筑物进行高度还原,使游戏 画面更加逼真。通过对卫星地图数据的处理和分析,AI 算法可以自动生成地形和建 筑物模型,为玩家提供一个丰富且真实的游戏环境。 实时天气系统:游戏中还运用了 AI 技术来实现实时天气系统,使玩家能够体验到 真实世界中的飞行条件。通过对大量气象数据的处理,AI 算法能够模拟出各种气象 现象,如云层、雨滴、雪花等,提高了游戏的真实感。

  用户创造内容(MOD)——我的世界我做主

  MOD 是游戏修改(Modification)的缩写,也称作游戏模组,是由游戏玩家自行开发的 游戏内容,主要有几种类型: 角色和皮肤 MOD:用于修改游戏角色模型,纹理、服装等外观。这类 MOD 不影响 游戏机制,主要满足玩家美化游戏和个性化的需求。 游戏机制 MOD:用于修改和添加游戏机制、系统、物品、关卡等。这类 MOD 可以 扩展和丰富游戏体验,增加游戏寿命。 情节和任务 MOD:用于修改和添加游戏剧情、任务、事件等。这类 MOD 可以给游 戏带来全新的体验,但需要和游戏原有内容完美结合。 重制 MOD:用于完全重制游戏的某些方面如画面、界面、人物等。这类 MOD 可以 让老游戏焕然一新,被许多玩家广泛运用。

  虽然 MOD 是玩家丰富游戏内容的一个主要工具,但是 MOD 制作给过程复杂且存在一定 技术门槛。对于普通玩家来说有些遥不可及。但随着 AIGC 时代的到来,一个普通的游 戏玩家也将有能力按照自己想法制作游戏 MOD 并丰富自己的游戏体验。 AIGC 不但可以帮助没有技术和美术背景的玩家快速生成角色与皮肤 MOD。同时 AIGC 可以成为一种 MOD 智能开发工具,玩家可以通过人工智能技术,使用更易上手的语言 甚至图形交互系统完成 MOD 的制作,这可以显著降低 MOD 开发的技术门槛。

  《Roblox》作为一款在全球拥有近一亿用户的沙盒游戏,同时也是目前世界上最大的多 人在线游戏创作平台,包含了成千上万玩家创造的地图、玩法和模式。其平台由 Roblox Client, Roblox Studio 和 Roblox 云三部分构成,其中 Roblox Studio 提供了一套适用于新 手到专业人员的工具,给予了开发者足够的创作空间和技术帮助。2023 年 3 月 21 日, Roblox 正式发布了两款新的 AIGC 工具,所有 Roblox 的开发者都可以选择使用 AI 为基 础的材质生成和代码辅助工具。其中,Roblox 的材质生成可以用来创作高品质纹理,并 运用在游戏内物体上;而代码辅助工具可以让用户通过自然语言指令创造代码,也可以 自动总结用户所写的代码并生成评论。可以预见,AIGC 使得游戏的 UGC 时代即将来临, 游戏内容与游戏体验将进一步获得提升。

  此外,还有一款名为《Arrowmancer》,运用了 AI 带来了全新的玩法。Arrowmancer 是一款由 WaifuLabs 团队制作的全 AI 绘图游戏,主要运用了 AI 技术生成和融合独特的二 次元角色。在这款游戏中,AI 技术的应用主要表现在以下几个方面: 角色生成:游戏利用 WaifuLabs 的 AI 技术生成各种不同风格的二次元角色形象, 丰富了游戏角色的多样性。玩家可以根据自己的喜好在大量生成的角色中进行选择。 角色融合:游戏允许玩家融合不同角色的卡面,创造出独一无二的角色。这种融合 过程由 AI 算法驱动,保证了每个融合角色的独特性和可玩性。

  AutoGPT——更聪明的 AGI

  2023 年 4 月,一个名叫 AutoGPT 的开源项目在 Github 上发布了,截止至 2023 年 4 月 16 日,该项目已经获得 70K+星。AutoGPT 是一个由 GPT-4 驱动的可以自主实现用户设 定的任何目标的开源应用程序。当用户提出一个需求或任务时,AutoGPT 会自主分析问 题,给出具体的执行计划并开始执行,直到完成用户提出的要求。可以发现,AutoGPT 打破了机器只能执行人类命令的框架,实现了由机器主动提出问题和执行计划,并由机 器自主完成的工作模式。

  可以想象,类 AutoGPT 产品可以在游戏中为玩家提供帮助。例如当玩家不知道如何通关 游戏时,玩家可以通过 AutoGPT 浏览整个游戏并得到详细攻略;当玩家纠结于游戏装备 或角色的选择时,可以在 AutoGPT 中输入自己的偏好而获得一个完整的建议;当玩家由 于操作原因难以通关时,AutoGPT 可以生成一个“外挂”应用帮助玩家完成游戏关卡; 甚至当玩家需要一个队友时,AutoGPT 可能可以生成一个 AI 队友。虽然这些设想看起来 十分遥远,但 AutoGPT 的出现让我们看到了希望。

  GenerativeAgents——通往元宇宙的里程碑

  AutoGPT 让大家看到 AGI 具备迭代推理的过程,在使用时为完成最初的任务,AI 会不断 “Add Task”,使答案不断完善。正如我们此前用 ChatGPT 写文章的时候,需要按提纲 给出一系列提示词,让 AI 按序作答,提示词的质量直接关系到内容输出的好坏。而今 AutoGPT 把提示词工程师的工作给“抢”了,按此类推,如果呈现为多模态,那就是赛 博朋克的《失控玩家》了。 不论是智能 NPC、非线性游戏还是用户创造内容和游戏助手,它们都能够从不同的角度 提升由于的游戏体验,这一点在开放世界游戏中体现的尤为明显。例如,智能 NPC 可以 为玩家带来更强的交互性和代入感,并带来更强的情感体验,这是因为智能 NPC 会根据 玩家的选择和行为做出灵活的反应,使得玩家更容易投入到游戏世界中;而非线性游戏 可以为玩家带来更深度的思考和真正个性化的体验,这是因为非线性的体验带来了更加 复杂的游戏情景和游戏决策,可根据玩家喜好产生个性化的结果,实现游戏的“千人千 面”。

  智能体虚拟小镇,不是游戏的游戏

  科学家们确实在向这个方向探索,《西部世界》是一部科幻类连续剧,讲述了一个由机器 人组成的乐园中发生的故事。在那里的机器人能够像人类一样生活、工作、社交,甚至 记得自己看到的东西、遇到的人、说过的话。《西部世界》如果作为一款游戏,无疑是一 种体验极佳的开放世界游戏。但是,虽然这只是影视剧中的一个设想,生成性智能体已 经在学术论文中实现了。

  在由斯坦福大学和谷歌联合发表的一篇名叫《GenerativeAgents:Interative Simulacra of Human Behavior》论文中,研究者们成功地构建了一个“虚拟小镇”,其中的 25 个智能 体在小镇上生存。它们可以在咖啡厅喝咖啡,可以去上学,甚至可以举办派对,而研究 者们也证明了它们能产生可信的个人或突发群体行为的模拟。

  这是个非常有趣的实验,其中的 NPC 具备了可信人类行为,并对周围环境变化做出适当 的反应,使得可以用现实社会现象去填充赛博空间,并允许终端用户改变环境或用自然 语言下达命令。例如,John 早上 7 点起床,刷牙、洗澡、吃早饭、看新闻,8 点 John 的儿子起床准备上学,临出门前会有一段契合语境的对话,并在后面的时间序列中遵循 对话的逻辑和内容。也就是说,在这个虚拟环境中的每个决策都带有一定随机性,但又 符合人类行为习惯。用论文中表述即:GenerativeAgents 利用大模型强大的提示词功能, 支持智能个体长期的一致性、管理动态演变的记忆能力,并递归产生更多的世代。 此前,我们看到 AIGC 辅助的用户创造内容(MOD)能够帮助玩家提升开放世界游戏的 游戏体验。一旦 MOD 的制作不再需要极强的技术能力以至于每个普通玩家都能设计属 于自己的 MOD 并将其分享出去,游戏的内容将获得极大的提升,玩家能具有的游戏体 验也将极大提升。未来,GenerativeAgents 能在不毁坏游戏体验的前提下帮助玩家不再 需要一个真人队友就能体验到随机性、社交性。

  为什么元宇宙需要 AIGC?

  2021 年时,我们试着在 Decentraland 中修建了首座元宇宙虚拟总部——“国盛区块链 研究院”(坐标 62、28),并尝试进行了几场线上路演,当时还吸引了圈内外不少朋友关 注,但作为元宇宙早期产品,Decentraland 做了大开脑洞的尝试,却无法真正构建数字 空间,其原因在于:

  1)缺乏相应的内容生产工具

  Decentraland 提出了虚拟土地概念,类似于门户网站的广告位,在有流量的情况下,虚 拟土地 NFT 的价值有一定体现。但用户缺乏内容创作工具,作为普通用户无法在土地上 构建差异化内容,必须依靠专业团队构建虚拟建筑,本质上还是 PGC,门槛过高。而同 期的 Roblox 虽然是体素方块,却为青少年提供了从云到游戏工具的一系列产品,易于上手,反而积累了用户。

  2)使用壁垒过高,长期门可罗雀

  Decentraland 等元宇宙首批平台对终端配置要求过高,严重影响了用户体验,在经历了 初期的火热之后变得门可罗雀。在 2022 年的一年时间里,Decentraland 不论是销售额 还是活跃钱包数量都发生了断崖式的下跌。销售额从 2022 年最高的约 9 百万美元下跌 到现在约 40 万美元,下降了约 95.7%,而活跃钱包数量从 2022 年最高的 900 多个下跌 到目前的约 250 个,下降了约 72.2%。这固然有 NFT 市场趋冷的影响,但本身产品的 不足亦不容忽视。相比于成熟的 Web2 应用,这类平台的用户非常小众化。

  因此,当我们用 NFT 确认数字资产权属之后,实现了链上资产的可流转、可溯源,这是有创新意义的。而后的主要矛盾就变成如何构建真正非同质化的内容?早期在赛博空间 中划分出的功能区域必须带入可信人类行为才能真正有意义,比如学校用来模拟学习场 景、公园用以自由社交,而不是到处都是交易 NFT 的画廊。我们看到 Web3 世界的某些 项目已经在这些领域做出了尝试,Decentraland 社区近日也提交了最新提案,创建个性 化人工智能 NPC,下一轮的前沿创新正在路上。

  AIGC+元宇宙——代入上帝视角,每天 24*N 小时

  通常而言,我们会以各个 APP 的使用时长占比来表征业务的变化趋势,当然,除去吃饭 睡觉,每个应用的时长都会有上限,例如手游 APP 的人均单日时长在 2020 年见顶 145 分钟后有所下降,基本保持 100 多分钟的平稳状态。而 AIGC 驱动下,用户将逐步具备 上帝视角,即便不是本人实时操作,只要代入个人行为特征,数字人就可以完成大部分 特定任务,玩家可以借助 AI 同时在 N 个虚拟世界执行任务。

  2018 年,一款名为《旅行青蛙》的游戏火遍全网,主角小青蛙出不出门、什么时候出门、 什么时候回来,全都是随机的,青蛙还会时不时写个信,但玩家还是时刻想了解青蛙的 旅行情况。当时的游戏用随机性满足了用户的陪伴需求,实现了“陪玩”的功能,如果 再加上 AIGC 的内容生成能力以及数字人呢? 在此前的《数字人——GPT4 下的杀手级应用》中,我们曾提到数字人将是未来 AI 的交 互界面。当下流行的 2D 数字人成本较 3D 大幅降低,可以被运用在以下四个场景: 服务业:在教育、银行、医疗领域提供服务,引入类似于 ChatGPT 的 NLP 大模型 以后,交互性会变得更好。如医疗导诊,尤其针对一些老年病人可以更好地做到一 对一的交互带领。教育领域,可以针对不同学生的进度提供定制化讲解。 影视作品:在电影、电视剧和动画片里作为演员存在,不但可以根据需求和剧情定 制形象,同时也能避免出现由于演员私人的一些行为导致整部作品无法按时上映的 风险出现。 虚拟 UP 主:娱乐直播、表演歌曲、舞蹈、游戏等,可以打造个性化的形象和风格, 定制化满足粉丝的需求和喜好,且不会出现塌房事件。 虚拟直播带货:利用 2D 数字人来制作营销推广、客户服务、产品介绍等视频,可 以提高转化率、增强信任感和体验感。

  如上如是笔者自己生产的 2D 仿真数字人,口型、动作、声纹的合成技术已经相当成熟, 在日常场景中已难辨真假,且具备了多种商业模式。在这些场景中,我们已经可以实现 用 GPU+电耗生产内容,未来随着垂直模型的训练成本降低、效率提高,互动性将大幅 提升,针对游戏、直播、工作等不同场景的数字助理将应运而生,虽然看起来像一个大 型游戏,但它真的还是游戏吗?代入上帝视角后,用户可以穿越于不同的赛博空间中, 从内容参与的角度看,我们每天的时间或许会变成 24*N,而元宇宙将成为无尽的游戏, 无疑,这对下一轮 TMT 的意义是重大的!

  来源:未来智库


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1