2023年9月9—10日,人人都是产品经理联合腾讯大讲堂举办的【2023产品经理大会(北京站)】完美落幕。腾讯光子联合探索组 AIGC产品经理Hali老师为我们带来《AI时代,人人都是产品经理》为题的分享,本文为演讲内容实录。目前大会回放已上架,戳此购买,即可收看回放:https://996.pm/7gX2B
今天我分享的主题是《AI时代,人人都是产品经理》,主要从三个方面切入:
大家在使用Midjourney的过程中有没有出现过类似问题:不知如何去表达脑海中的想象,即使借助提示词工具、数据库工具等,也很难在众多提示词中找到满意答案,只能不断试错。
那么,有没有办法可以更加智能地写提示词?于是我用GPT和提示词工程搭建了一款AI绘画提词器,比如输出“产品经理”,提词器会从6个维度展开提示词联想,任何一个关键词都配置了GPT推荐的一个解释。这时候点击解释,即可将解释复制到临时收藏夹中,随后一键复制参数,再将参数放到Midjourney里,即可得到解决方案。综上,用户可以通过一个非常短的输入得到大量的输出,且过程自主可控,并有各式各样的提醒。
这个工具存在的意义即让想象有更多的想象,比如输入“皮卡丘”,它可以为你展示皮卡丘的外貌,这个时候将这些外貌信息给到Midjourney,就能更好地控制Midjourney的表现;又或者输入“水下摄影”,提词器可以提供一些艺术家,我们可以用艺术家在Midjourney中控制画面表现;包括一些构图视角的参数也可以影响到画面,且提词器会为你解释推荐理由。
当然,这个工具的出现目的不在于取代屏幕前的你,而是为了帮助你获得更多的想象和描述角度。
现阶段,这款非常简单的工具产品已经有1万多人次使用,且有12多万次生成,我也借此建立了6个AI绘画社群,感兴趣的同学可以体验一下:MidJourney.TalkGame.AI。
接着展开讲解这款产品的研发工作流。我本身作为一个不懂任何代码的设计师,要如何完成这款产品的开发?这时,就要借助GPT-4的力量了,大致的工作流如下:
产品策划 → 产品设计 → 产品开发 → 提示词工程 → 上线
产品策划阶段:
吴恩达在其提示工程课中讲到:编写明确和具体的指令,留给模型足够的思考时间。基于这点,我开始进行测试,比如询问MidJourney“能否给我提供相应的设计师,风格要鲜明,描述他的风格,并提供对应的英文名”,MidJourney就给出了系列答案。随后再迭代先前的提示词,让它按照你的规则进行输出。最后,我们利用所得的东西返回前端。
产品设计阶段:
在交互领域,我感受到了一个特征,即GUI(图形用户界面)会向LUI(自然语言交互界面)进化,LUI可以大大降低用户的学习成本,更为简单、直接。比如这款工具,界面工具只有一个输入框,用户输入关键词,输入框下便可展开更多关键词,以词条形式展示。此时,鼠标悬浮词条将有对词条的推荐理由,用户只需要挑选、点击,然后一键复制。
产品开发阶段:
GPT带给我们更多的可能性,我便是在B站上搜索“自然语言编程”,尝试让GPT帮忙写代码。在产品开发上,所有的代码都是由GPT完成的,我所做的事情,就是建立一个TST文档,将代码复制粘贴进去。过程中也会遇到问题,这个时候,你可以将问题丢给GPT,它会告诉你问题出在哪里,随后你再解决即可。
就这样,在某个深夜的凌晨四点,我终于将它开发出来了。过程中也有技术大佬的支持,比如帮忙搭建服务器等,最后,便搭建出了一个超级MVP。
提示词工程阶段:
基于MVP模型不断地迭代,同样“编写明确和具体的指令,留给模型足够的思考时间”,然后进行迭代,输出不同维度的提示词,通过这些产出,我们得到了最后的产品。
在能力标准上:
效率指标——在繁复地词条记忆和词库筛选过程中,我们迭代了“聪明地提供词条建议”,所以输入一个简单词汇,工具便可以展开丰富联想,效率至少提高了100%;
技术能力——通过对GPT进行数据集训练,而后提示词工程生成JSON代码,最后在前端页面表现。这个过程中,GPT可以真正地服务于我们的工作流程,而不仅仅服务于对话;
于自身而言——我从一个不懂技术、不懂代码的人,到结合GPT-4,实现了一个像模像样的产品,开始学会运用AI能力解决用户痛点。
以上实践,让我真正地参与到了这场AI变革当中,并由一个将要被AI淘汰的设计师,转型成为了一名推进AI发展的产品经理,为淘汰设计师这件事,“贡献了”一份绵薄之力。
二、独立游戏美术资产AI全流程探索
我们基于斯坦福AI小镇这款游戏的技术与场景,做了一款游戏demo《伊甸岛》,这款AI游戏的一个目标在于,让NPC不止有GPT的脑子,还有GPT的眼睛和GPT的身体,NPC可以充分地认知所处的世界,且NPC输出的内容和行为不脱离游戏场景,最终,用玩家与虚拟世界的交互去影响游戏走向。
可以看到,由GPT操纵的NPC遇难漂泊到了一座荒岛上,NPC会和世界发生自主交互,目标是完成逃生。在这个过程中,玩家作为上帝可以进行有限的影响,玩家与虚拟世界的交互会影响游戏故事的走向,产生蝴蝶效应。NPC则在过程当中记忆它的事件,迭代执行逻辑,并不断地学习和相互协同。
而我们想探索AI Agent在极端环境下,是否会产生违背人性伦理的行为?最后的结果是没有,GPT对这类现象的发生是有所限制的。
值得一提的是,在开发过程中,95%的美术资产全部是由AI生成的:
当然,过程中也遇到了一些工作难点。
这里简单介绍一下我们走过的弯路和突破点。
在道具资产上,我们起初通过复杂的提示词以期望达到稳定控制的效果,也尝试使用MJ生成资产雏形,再使用SD去控制统一风格,但效果都不是很好。所以最后我们通过艺术家的限定,实现对MJ产出结果的绝对控制,利用AI提词器找到某个具体的艺术家,运用其设计风格,最后得到结果。而产出的素材已经基本符合做独立游戏的要求,在一到两个小时之内,我们便解决了所有的游戏资产。
原画资产同样都是由AI生成的,风格统一,只需一个艺术家,便可解决原画资产问题。
人物资产相对复杂一些,最后,我们通过MJ的皮克斯风格实现对产出效果的控制,并使用SD文生图加上ControlNet去统一风格。可以看到,每个角色的形态都非常稳定, MJ生成了稳定角色,再利用SD转换成手绘风格。
地图资产的生成也遵循大致相同的逻辑,即使用SD进行原始地图生成,再使用MJ生成地皮纹理;游戏Logo资产也大致类似,使用SD的图生图模式,加上ControlNet的Canny、Reference和Tile进行风格迁移。我唯一做的事情,便是用PS生成了一个底图垫进去。
综合上述内容,可以看到我们的工作成果:
对于初学者而言,所谓的参数、工具可能会看起来很复杂,甚至不知如何操作。那么,有没有什么方法可以直接抄大佬作业呢?比如我们可以下载源文件在PS里修修补补,最终得到自己的产出,那么这个过程,是否有可能复用到SD上?
结果是有可能的,即使用工具——SD工作流的开源插件,LightFlow。这款工具的使用很简单,它可以将所有SD操作数据打包,生成工程文件,而后直接一步到位给到SD复原所有工作。
可是问题来了,我们要去哪里找LightFlow源文件呢?为了解决这个问题,我们搭建了一个SD工作流开源社区:https://LightFlow.ai/ 。大家可以在社区上分享SD工作流,用户在进入社区后挑选自己想要的效果,点击下载,然后打开SD将文件拖拽进去,一键设置好所有参数,最后,点击生成。虽然过程可能看不明白,但无所谓,我们可以直接得到结果。
创作者也可以通过LightFlow导出所有操作数据,上传工作流,分享给社区用户使用,从而建立自己的AI绘画的影响力。使用者则可以挑选相应的工作流,下载LightFlow源文件,通过LightFlow一键导入所有操作数据,得到新的生成。
综合来看,LightFlow极大地降低了初学者的学习门槛,可以实现“大口喂饭”、一键进阶;而对于SD进阶者而言,LightFlow则可以帮助保存优质工作流,从而实现快速复用、一键复现。SD进阶者也可以发扬开源精神,帮助建设SD生态。
这也隐含着另一种商业化的可能性,比如SD大神可以帮助企业建立一系列可复用的工作流,而后打包给企业,帮助企业团队快速建立AI绘画能力,实现降本增效,真的“让AIGC像光一样流畅”。
总结:为什么AI时代,人人都是产品经理?
有一个概念,即“奇点时刻”,意思即电脑智能与人脑智能兼容的那个时刻。孙正义曾经说道:
在30年后,计算机、人工智能,他们都将会比我们聪明,对此我深信不疑。所以我们只在一件事上投资了1000亿美元,那就是人工智能。
某种意义上来看,ChatGPT 的出现其实就是一种“奇点时刻”,它用最简单的方式改变了全世界对人工智能的一个看法。
而对于我们而言,这也是一个新的时代机遇,各行各业都可以用AI重新定义,而我们可以在落地应用这一维度上发光发热,因为太多的需求都可以被重新满足,我们要尽可能去创造新的需求。比如对于大企业来说,AI提高生产力是很有效的,也是很有意义的,大企业可以在过程中实现降本增效。而对于小团队或个人,则可能更应该去考虑如何利用AI创造新的需求,从而实现“弯道超车”,创造更有意思的结果。
人人都可以发现新的、未被满足的需求,譬如我先前的身份是设计师,了解设计师的需求所在,所以做了AI提词器、搭建了SD工作流,而这些就是新出现的、未被满足的需求。如果想突破,我们可以往这些方向进行琢磨。别想太多,做了再说。
最后,于我自己而言,我是一名忠实的 AI 降临派。在《纳瓦尔宝典》这本书中,有一个词,即“专长”。我通过自己训练的一个苏格拉底的GPT模型,找到了自己的“专长”——我是一个擅长发现新需求、擅长提升用户体验的人。而我的愿景,是推动AI的发展;我的夙愿,便是成为硅基生命的垫脚石。如果你们也和我一样,那就真的“泰裤辣”!
大会直播回放
目前大会回放已上架,戳此购买,即可收看回放:https://996.pm/7gX2B
本文为【2023年产品经理大会(北京站)】 现场分享整理内容,由人人都是产品经理运营@Norah 整理发布。未经许可,禁止转载,谢谢合作。
题图来自大会现场