当前位置:首页|资讯|AIGC|AI写作|Stable Diffusion

「浪尖上的外卖咖啡」土豆人tudou_man X 美团外卖

作者:土豆人tudou_man发布时间:2024-03-07

@土豆人tudou_man X 美团外卖

AI的1000次演进,只为做1杯上海的外卖咖啡
受美团外卖的邀请,为2023年的上海咖啡文化周创作一件AIGC概念作品。作品以上海苏州河游船为创作原型,采用实景采集与Mid journey + Stable-Diffusion组合的方式创作,通过上千次的叠加演算,近乎真实地让浪花载着一杯巨大的外卖咖啡出现在苏州河上。

整件作品打磨了半个月,这让很多人会困扰AIGC不是5秒就可以出结果么?为什么一张图片需要做这么久?因为我想解决一个问题,那就是AI创作的可控性,这也是今年创作学习中遇到的最大难点。想信不少人在使用Mid journey创作时,都会遇到盲盒抽卡的情况,越是在脑子里想清楚表达的画面,给到prompts后越是生成不准确,往往得通过大量刷图去求得随机的“惊喜”。内容生成的随机性与不可控性也让目前版本的Mid journey(V5)很难成为专业设计的生产力工具。不过在成像质感和画面基调上Mid journey有着非常惊艳的效果,是不可多得的创意灵感工具,可以在合适的项目中把它放在沟通排头兵的位置上。

以这次的作品《浪尖上的外卖咖啡》为例,前期沟通时,Mid journey凭借出色的呈现质感以及快速响应,直观的把idea“一杯在浪尖上的外卖咖啡”生成出来(图1)。在画面的大感觉上,干爽透亮的影调和外卖咖啡清透的光泽感都是非常具有参考价值的,很好的圈定了作品的基调。

                   

图1 Mid journey构建概念氛围

同样问题也很明显,Mid journey不具备产出指定元素和具象内容的能力,譬如画面就没办法展示上海苏州河的码头,没办法生成上海三件套的地标建筑,没办法把外卖咖啡放在一个真正的浪花船上。所以在创意表达内容呈现诉求近乎苛刻的前提下,AI可控就显得至关重要。基于此,在进一步创作时,我使用到了Stable-Diffusion来完成创意具象化的工作。在进入新工序之前,这里还有个准备工作,就是实景素材采集(图2)。因为很多具象的地标建筑,在Stable-Diffusion的大模型中可能并没有收录学习,所以需要采集一些现场照片素材帮助Ai学习认识,在生成时达到较为真实的环境呈现效果。

图2 上海苏州河外滩源码头实景素材采集 

在收集来的实景素材基础上,通过简单的草图绘制(图3),会整合进Stable-Diffusion的工作流中来,至此画面已经有了初步的创意呈现雏形。这也是AIGC工作流的一次新探索,区别于以往的工作经验,草图创作并没有放在项目最开始的步骤里,而是出现在创作中期,且起到了重要的ai执行提示的作用。
                     

图3 合成草图 

在Stable-Diffusion中,通过Control net模型控件的组合配置,基本可以把上海外滩源码头的场景还原出来,远处的三件套地标建筑也基本复原(图4)。环境问题解决了,那么现在的主要精力,就回到了对主体物的深度刻画上来,不断的使用局部重绘去迭代海浪与外卖咖啡的呈现效果,进入细化阶段。                         

图4 stable-diffusion概念刻画 

创作过程本身也是作品的一部分,这次我从起稿到成稿过程中的1000余幅画面进行记录(图5),在我的个人主页上还生成了这一条30s的创作短片。时间就花在了这里,不断的去推翻细节,对每一个局部、建筑、浪花都去进行精细化计算,小到码头上的那颗路灯,都是精心选择的结果。                  

图5 1000+次的演算迭代

最终作品《浪尖上的外卖咖啡》(图6)在我半个月的打磨中敲定下来。这千余次的细节重绘,实则是一场与AI审美表达的博弈。AI的根据关键词的每一次噪波演算,都有它的学习与思考,我不断的将其推倒重绘,事无巨细的给予它修正和引导,将我想表达的内容更一步具象迭代。可能这也是人参与AIGC创作的意义所在。

图6 《浪尖上的外卖咖啡》by:土豆人 tudou_man x 美团外卖



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1