文字、图片、影像……自ChatGPT开启新AI时代后,AIGC生态就以前所未有的速度成长,而AI绘画作为AICG领域C端应用最耀眼的存在,是否真的已经完成从绘画工具到灵魂画手的转变?
011
狂飙猛进的AI绘画
从“如何才能体验AI绘画工具”到“我应该选择哪款AI绘画”,AI仅用不到两年时间就让国内网友陷入选择困难。一方面,百度文心一格、阿里云通义万相等含着金钥匙出生的AI画师依靠巨头大模型生态顺利进入用户视野,另一方面,美图秀秀、盗梦师等工具类软件融入AI后凭借差异化赢得不少网友青睐,AI绘画彻底进入百家争鸣的时代。
AI绘画技术的持续地推动整个终端应用市场繁荣,而OpenAI团队来源的深度学习模型 CLIP(Contrastive Language-Image Pre-Training)可以说是推动AI绘画走向繁荣的契机。借助网络,CLIP模型搜刮了40亿个“文字-图像”训练数据,通过这天量的数据,再砸入让人咂舌的昂贵训练时间,CLIP模型终于修成正果,大众首先熟知的AI绘画产品Disco Diffusion,正是第一个基于CLIP + Diffusion模型的实用化AI绘画产品。
OpenAI可以说是AI绘画领域重要“推手”
然而,Disco Diffusion虽在画作上给人颠覆性视觉体验,但其模型在像素空间中进行计算,这会导致对计算时间和内存资源的巨大需求,这给予AI绘画模型Stable Diffusion、MidJourney们崛起的机会,加上同一时期OpenAI团队也推出DALL-E 2,较低的硬件需求和较短的绘画时间开始让AI绘画在大众领域传播,即便没有任何绘画基础的人,也可以通过几句话的描述让AI帮助自己“创作”出精美的画作,进而让AI绘画真正成为AIGC时代的现象级应用。
021
从工具到社交的野心
巨大的研发投入和运维成本只为吸引更多的用户流量,再通过用户付费实现盈利?显然低估了AI绘画门的野心。
AI绘画最初的定位是生产力工具,他们不仅可以提供基本的绘画功能,适合初学者练习和探索,更可以在动漫设计、游戏场景创作等场景中,通过智能的AI算法为设计师自动匹配出优秀的配色设置构图方案,让设计师汲取灵感的同时,完成基础的底层构图工作,通过生产力属性创造价值。
而随着互联网科技巨头大模型的介入,AI绘画逐渐从生产力工具向平台发展。巨头旗下的AI绘画产品而相比于其他文生图大模型产品,往往除了可以提供文生图模型,更重要的是能够基于平台的算力、推理加速能力以及众多开源模型,去帮助用户更方便和快速地翻训自己的垂类模型。定位“平台”的AI绘画应用不仅仅可以提供文生图模型,往往还自带一套算法框架,用户可以直接在平台上去训练自己的模型,而不需要另外在本地部署环境,大大降低门槛,成为AI绘画发展过程中的重要阶段。
模型训练让人人都能拥有属于自己的绘画“大模型”
平台的构建,意味着一个普通人也可以更快更好地训练自己想要的垂类大模型。用户只要用10至20张的照片放入到自己新建的模型中,AI绘画平台大概只需要几分钟的时间就可以生成一个能够生成一个属于用户的大模型。这个过程中没有任何代码编写、数据清洗等等以前只有AI工程师需要做的工作。只需要选择模型,拖拽数据,就可以实现最终的结果。
平台化的AI绘画工具足以令AIGC领域开启新一轮爆炸式增长,而随着用户模型及作品的涌现,平台化的AI工具也能衍生为模型或内容社区,在授权、交互、共享模型数据的过程中,构建大模型翻训链。比如,A是一个开源基础模型,B是在A的基础上加上一些垂类数据训练出了一个在跳舞方面更专业效果更好的垂类模型,C又在B的基础上增加了唱歌等数据训练出新的不同模型。AI绘画模型所搭建的平台最终希望做到的是,将模型训练依赖链条进行明确,方便每一个大模型拥有者进行翻训,也方便大家管理自己的大模型上下游应用。
在整个平台化、社区化发展过程中,AI绘画背后的互联网科技巨头不仅能成为技术、数据的“卖水人”,更能在上下游模型权限的清晰界定以及涉及商业数据的存放等领域掌握足够的话语权,帮助平台、社区用户实现内容变现的过程中,分享整个AI绘画生态成长红利。而在这之前,互联网科技巨头首先要解决的依旧是AI绘画的基建工作,无论是大模型的研发还是训练,都是资金、技术密集型投入项目,这也决定了AI绘画未来可能仅是少数巨头的狩猎场。
031
AI绘画“钱”途如何
原画、概设、氛围参考……AI绘画越来越多被游戏、动漫甚至教育等领域,除快速生成画作之外,“AI作画能否取代人类创作者”的话题也引发热议,在社交平台话题#一张画证明人不会被AI取代#中,网友们发表了不少充满想象力的画作来证明人胜过AI。
相对于创意,AI生产力属性创造的价值才是其备受追捧的关键。以国外较具有代表性的三家AI绘画公司--Midjourney、Stability Al、OpenAl为例,三家公司的单次生成费用,不超过0.3元人民币。而这三毛钱的费用,可以让用户次生成最少4张图片。以Midiournev公开的试用模式为例,25分钟的免费GPU时间,可以大致支撑25次免费生成。也就是说,AI绘画1分钟出1张图,向用户收不到毛钱,且可以用于商用。
这样的出图速度,人工是难以企及的 。据业内人士透露,某游戏公司将皮肤绘制的工作外包出去,每张稿费五六千元,画师需要画一个星期。而在小红书上,兼职画手出单张原创头像,从接单、出初稿到修改,也需要两三天的时间。
AI绘画背后其实是算力、算法的比拼
AI绘画也并非完全没有劣势,大模型是AI绘画的核心竞争力,可大模型背后的研发成本和投资回报比率的风险,并非所有公司都可以承担。OpenAI1750亿参数的GPT-3耗费了大约500万美元的训练资金。
据Stability AI的公开数据,维护一个拥有4000块英伟达A100 gpu组成的算力群,需花费超5000万美元。同时高投入并不一定能够带来成果上的高回报,而在研发成本之外,每生成一张图也需要相应的运行成本。百度文心一格团队表示,AI绘画是一个超大规模的复杂计算过程,需要大量的资源来支撑计算需求。AI绘画依赖显卡的算力,生成图片的复杂度和精度越高,显卡运算的时间越长,而一张高性能显卡在云平台的租赁价格在一小时15元左右。为了节省时间,用户经常需要租赁多个显卡并行运算,这导致AI绘画的运算成本并不像想象中那么低廉。
从这里看,AI绘画领域虽然前途似锦,但却需要无数金钱和技术铺垫,而在高谈理想和未来之前,通过出色的绘画能力俘获用户流量,沉淀大数据才是根本,而在最底层的“文生图”应用上,各家AI绘画又表现如何呢?