3月31日,“GDC 2023 中国行—予力游戏 赋能开发” 在线下与线上同步举办。活动不仅带领开发者们一同探索创新的开发工具、商业策略和生态项目以加速游戏的开发及客户的留存与增长。还进行了包含Xbox演示及7大游戏案例展示;GDC旧金山现场直击以及解析GPT-4加持的Azure OpenAI在游戏NPC场景与制作场景中的应用案例分享与技术探讨等内容。
在活动上,完美世界移动项目中台技术美术主管 Gary Guo带来了《AIGC对游戏资产管线的影响》。
家好,我是完美移动项目支持部门TA的主管Gary Guo ,今天给大家介绍一下我们在AIGC相关的一些应用,目前还处在比较早期阶段,所以展示的资料也是我们自己的尝试,给大家做一些简单分享。今天的分享分两部分,一是ChatGPT,二是文字部分的应用。
处于尝试阶段的AI应用场景
NPC对话、文案、场景、世界观的尝试
下图是GPT-Turbo的API,在配合Metahuman转口型+Azure转语音,最后在实时地做NPC的对话交互。目前还在尝试如何把动作、表情、文本和动作行为整合起来,这是未来研究的方向。
下一个案例是GPT如何帮助做文案,包括世界观、对话等。对于大文字量的游戏,剧情策划需要不停的堆量,这个案例是一次尝试,让AI帮助配图。需求是需要在AI讲座上做分享,帮我生成一些配图的关键词。
经过几轮引导,得到一句话。把这句话输入MidJourney,到得下面这张图。这张图的主题是:任何人都可以将自己的思想变为图形化的表达。以前可能需要专门的设计师来做,还需要自己会画画。那么在没有的情况下怎么办?ChatGPT+xxx就可以做到这样的表达。
大家知道,在游戏中有一个概设的阶段,包括场景的概设、人物概设等。下图是去年我们做的尝试,我们想用扫描建模做一个腐败的寺庙,需要一些指导,包括寺庙怎么搭建、光影怎么设计等。下图是通过关键词生成的气氛的概设。
在没有传统美术介入的情况下,花了一周做出了完整的场景。这里每个模型都超过400万-500万面,整个气氛概设是根据AI做出来的。
这个寺庙是五塔寺,我们去年8、9月份去拍摄了一天,回来时候扫描建模的自动化处理流程,把这些模型做完,最后导到引擎里面,用概设的指导搭建。整个流程2个人花了一周就完成了。
人物模型的尝试
下图是我个人早期的一次尝试,用了C站公开的Stable Diffusion模型做三视图的设计。这个 设计是想做一个露肩的女战士形象。
已成功落地的AI应用场景:UI、图标、图片
下面分享一些在具体项目中用到AI的情况。
第一个需求是游戏图标。我们发现应用场景中,UI是一个很好落地的场景。我们现在在尝试根据设计、线框、半成品,做出右侧的图标。图中右侧的图标全部由AI生成。
下图中左侧是项目中的画的UI图标,右边是经过定制的画风训练和微调,得到的一批UI。可以看到,在Stable Diffusion训练流程下,还原画风是非常容易的。这两套图标放在一起,即使是画的人也不能完全区分,其他人更是看不出任何区别。这是一种落地场景,可以做UI的批量生产,甚至在基础上做升级控制。
下一个案例是从游戏中截取图片,加上目标画风做融合,最后得到的是右侧的图。它比较适合loading页,需要模糊的背景烘托气氛。这也是一种应用方向,可以快速截取场景图,把画风和元素保留下来,成为右侧这些快速产出的资产。
下图是装饰的设计案例。左边是游戏内的装饰品,右边是训练的AI产出的图。可以看到,这里尝试的是统一的设计元素,左上角给的关键词是金属,中间右侧的关键词的冰晶,左下的关键词的蒸汽朋克。这个案例告诉我们,可以在训练出画风和知识的情况下,告诉AI想要的点是什么,让AI给出方案,进行挑选。
下图是魔法武器的案例,左边是游戏原画,右边的训练的结果。个人认为这个案例是效果最好的,两边放一起几乎看不出区别,无论是结构的合理性、设计元素、画风等各个方面。
AI辅助的3D生成,若成功实现将是一次技术革命
还有一个大家都在做的,就是辅助3D生产。终极目标是原生3D资产本身的生成,比如描述一个箱子,生成的是一个箱子的3D模型。如果可以实现,会是一个很大的技术革命。
不过,在这之前还有很多可以尝试的东西。首先3D贴图的生成,左边是blender的一个插件,把简单的模型建好后,拍个图给able Diffusion,它会帮你把材质做出来。右边是用Stable Diffusion直接生成四方贴图,这个贴图是在完全AI的情况下做出来的。在有这张图之后,可以靠他计算出其他PBR资产。这两项我们也在尝试。
AIGC爆发下的一些思考和感悟
下面和大家聊聊,在AIGC爆发的情况下如何应对这种环境变化。
第一个想表达的是,任何人都可以把自己的思想化为图形的表达。下图也是ChatGPT给出的关键词给到MidJourney帮忙生成的。
那么个人在这种环境下如何定位自己的发展?有个明显的情况是,AIGC爆发后,大家外包的预算和外包的形式都有很大的变化。尤其是翻译,做多国本地化部署的时候,ChatGPT可以给出极高质量的翻译。所以最先被干掉的是翻译外包。
下面这张图的关键词是创意、世界观构建这些创作要素变得更具价值,如果是一个实习生、一个外包,能做得比AI更好么?我的整个演讲PPT仅用了两天制作,这些图片全部由AI生成,非常明显地提升了工作效率。
在这样的环境下,个人的竞争力是什么?首先是创意,这个创意不是创意的具象化,而是作为一个人,自己对世界的感受、人生的积累,最后形成的极具情绪化的感受。第二是对世界观架构的能力,以前的文案策划岗位以后可能不存在了,他可能叫世界观架构师,用ChatGPT把自己的想法构建出来,再用MidJourney画出来。最后把这些创意和想法告诉游戏团队,我要这样的世界。
这样的人才是以后需要的。以前我们觉得想得多比如做得多,现在反过来了,想的多是一个优势。脑洞足够大,创意足够多,对一个东西钻研得足够深,热爱足够强,那就能脱颖而出。
最后是团队在这种环境下如何做抉择和竞争,这也是一个很现实的问题。比如美术团队想招一个2D绘画,你怎么考核他?我们的团队收到过用AI作品进行面试的,给了主题、给了参考,提交的作品又快又好。感觉有AI的痕迹,但也分不太清。那这个人你招不招?
这就是我们需要思考的问题,在AIGC的环境下,一个人点子多,AI软件用得熟练,审美能力强,那他做的东西就是又快又好。
相应地,团队怎么办呢?很多独立游戏团队已经很积极的使用AI工具,可以预见很多有创意的独立团队会开始做相关的事情,对于大公司来说会多很多的竞争对手。当我脑洞足够大,创意足够多,AI就能帮我实现出来。
未来一个人的能力边界是无限广阔的。一个集团本身有资源优势,在AI的情况下和独立团队的竞争拉到同一起跑线。独立游戏有能力做出3A产品,那么集团如何应对竞争,如何找到自己在AIGC环境下最独特的竞争力,这也是需要思考的。
4月12日,罗斯基视频号【快看斯基】将进行新一期直播,本次直播主题是:
《AIGC在游戏生态中的应用探究:如何提升效率与创意》
内容要点:
1、AIGC、OPENAI和CHATGPT是什么?
2、AIGC在游戏、电商、直播、社交行业的应用;
3、AIGC对互联网生态的改进;
4、AIGC的发展和前景;