当前位置:首页|资讯|AIGC|ChatGPT

亮剑“AI简笔画”,美图公司抢滩视觉AIGC

作者:砍柴网发布时间:2023-03-06

原标题:亮剑“AI简笔画”,美图公司抢滩视觉AIGC

2023年ChatGPT爆发成为科技圈最大热点,但很多人对其有一些误解,最常见的误读就是将其当成一种全新技术来讨论。实际上ChatGPT只是一个产品,其底层技术是已出现好几年的预训练大模型技术,基于该技术的AIGC产业早已爆发,其中AI绘画应用在2022年就已风靡全球。

从《互联网周刊》发布的“2022年度AIGC应用创新TOP30”来看,文字类、语音类和视觉类内容的生成是AIGC应用的三驾马车,其中在“2022年度AIGC应用创新TOP30”中排名第七的美图就主攻视觉类AIGC应用。去年底,美图秀秀推出的AI绘画在日本、美国、巴西、乌克兰、加拿大、澳大利亚、智利等全球十余个国家和地区引起强烈反响,直接跻身多个国家对应市场App Store免费总榜的第一名。

日前,美图又推出了全新一代的AI绘画功能“AI简笔画”,相较于上一代AI绘画应用基于文字关键词理解用户意图而言,“AI简笔画”可基于多模态图像识别与生成技术,自动识别用户简笔涂鸦原图的主体结构及内容,基于此对用户绘画意图进行洞察再智能拓展生成色彩、光影、细节、背景等要素,整个过程用户不需录入关键词,这一功能上线后迅速成为美图应用的爆款功能,日均生成图片已达到100万张。

在罗超频道看来,美图“AI简笔画”功能是AI绘画产业发展的全新里程碑,其相当于图片领域的ChatGPT,体现出了视觉AIGC的最新水准,意味着AI绘画2.0时代来临。这类全新的AI绘画应用将对绘画美术、影像设计相关产业将构成巨大冲击,对相关从业者来说,既有挑战、也有机遇。

美图“AI简笔画”上线

“视觉版ChatGPT”来了?

技术是科技产品创新的基础,反过来,产品创新也决定着技术的普及程度与落地速度。以2023年爆发的ChatGPT为例,它并不是革命性的技术,而是OpenAI对其2020年发布的GPT-3.5模型微调后开发出的对话机器人,虽然并无底层模型的显著突破,但巧妙地采用了理解、生成和交互相结合的方式,基于人类反馈进行强化训练,在体验上带给人强智能的全新感觉,一时之间名声大噪。

美图“AI简笔画”跟上一代AI绘画以及ChatGPT底层技术是一样的,均是基于预训练大模型的AI意图识别与智能生成技术。美图“AI简笔画”的突破在于可结合用户使用场景,让用户不再需要录入关键词来指定创作意图,而是可进行简单描绘,让AI基于“草图”智能绘图。从文字交互到视觉交互的突破,对AI绘画的普及有着十分积极的影响:

1、简笔画更利于用户完整准确地表达绘画意图。

绘画是具象表达,涉及到许多细节,用文字表达意图往往会词不达意,比如用户想要一幅城堡的画,在内心已有城堡大致样子,这时候用文字描述出来是很繁琐甚至做不到的。在使用美图“AI简笔画”时,用户可以简单几笔勾勒出大致的创思,填充、着色、细节等动作AI会自动完成。当然,用户也可使用基于文字描述的AI绘画功能,“AI简笔画”带给用户另一种表达需求的选择。

2、“AI简笔画”让AI绘画更具可玩性,趣味性,主动体验感。

在“只需要输入文字就能生成绘画”的AI绘画中,用户没有任何绘画动作,这让用户体验感、参与感、趣味感大打折扣。为什么人们有了系统自带的相机还都要装美颜相机这种应用?因为拍摄、修图这些让照片变得更美的过程,本身就很有趣,是很有体验感的过程。同理,“AI简笔画”让用户可以玩涂鸦,再基于此获得智能绘图,这种模式的体验感是强烈的,至少是真的在“画”。

很多用户并不善于或者不乐于写文字去表达,但两三岁的小孩都能尝试涂鸦。美图秀秀“AI简笔画”甚至不需要用户画出完整涂鸦,只需寥寥几笔线条就能智能推测用户意图生成作品,可以说“AI简笔画”让AI绘画的体验门槛大幅降低,趣味程度也被提升了,这会让AI绘画在普罗大众中进一步爆发。

3、“AI简笔画”让AI绘画回归到艺术本身。

绘画跟音乐一样,是人类与生俱来的表达力,比文字、语言都更早出现,用于人类的表达沟通交流、记录传递信息,实际上文字也是从图形发展而来的,众所周知,甲骨文是中国目前已知最早的成系统的文字形式,甲骨文是象形字也就是从图形演变而来的文字。总而言之,描绘是人们最基础的表达能力,在绘画时用简笔画这样的表达,比文字更为自然。

有了“AI简笔画”这样的应用,AI可以基于人们的涂鸦、绘画,协助其生成更多高水准的画作,这意味着更多人可以创作艺术作品,艺术成为门槛更低,更平权的人类活动,这也是“AI简笔画”的深层意义:它让AI绘画更接近于艺术,也让更多人可以参与到艺术的创作过程当中。

“AI简笔画”的冲击波:

商业化落地加速

其实用机器来辅助人类绘画已有多年发展历史。早在20世纪70年代,就有艺术家探索用计算机画画,很早的Windows系统就内置了画画软件,我印象中,最开始接触计算机不会打字,先玩的就是画画应用。随着互联网大数据的爆发以及深度学习特别是AI大模型技术的发展,AI绘画具备了更强的能力,特别是2022年爆发的AI绘画,在清晰度、丰富度、艺术性上有了质的提升,图像生成时间也大幅缩短。

AIGC一日千里,但不管AI绘画如何发展,人类依然是艺术的主宰,上天赋予人类的创作力是不可能被剥夺或者替换的,因为创作力的底层是灵感、思想、精神、情绪、天赋、荷尔蒙等等,这些是机器目前无法具备的。

朋友圈一位广美的老师在体验了美图“AI简笔画”后表示,AI绘画技术确实越来越强大了,它们未来可以在美术基础教学中发挥作用,比如画作修改、矫正、评审,也可以帮助一些基础水平创作者进行绘画作品修饰,但AI绘画永远不可能取代人类:美术的基础是审美,“灵感”是人类独有的,“19世纪摄影机被发明,肖像画家面临失业困境,许多画家不得不主攻新方向,梵高、毕加索等艺术大家出现,他们的画作不只是摄影机拍不出,任何技术都不可能真正创作出来。”

此外,人工本身就有独特的魅力与价值,深圳大芬油画村的阿姨一辈子都在画《蒙娜丽莎》,理论上来说其手工作画过程完全可以被机器替代生成一样的作品,为什么依然会有很多人要花更多钱买手工画作用于装饰呢?还是很多人会喜欢“手工”的事物,特别是在艺术文创产品上。

在基于文字表达的AI绘画爆发后,已经出现许多围绕AI绘画“搞钱”的群体。

一类是基于国外开源AI绘画系统搭建自有AI绘画应用如小程序,再通过广告、付费、增值等模式赚钱的“中间人”;另一类则是AI绘画衍生出来的职业或者对一些职业的“赋能”:“AI绘画师”将自己的创意、想法利用AI绘画工具生成作品后,进行售卖,更多人则用AI绘画生成插画、漫画、壁纸、儿童绘本、动漫同人、国风山水画、潮玩、logo设计图等进行商业变现。

随着美图“AI简笔画”这类新一代AI绘画功能的出现,AI绘画的生产力与艺术性将被大幅提升,这对绘画相关的产业来说存在许多机遇:

一个是做AI插画、海报、绘本、漫画的创作者可以更好地生产作品,他们可以发挥“自己本身就会画”的特长,在简笔画、素描、草图这一“起点”上超出没有绘画功能的人一截。而且值得期待的一点是美图“AI简笔画”底层的AI预训练大模型仍在高速进化中,未来的创作能力会如何,今天无法想象,如果继续发展,未来动漫乃至动画或许都可以在“AI简笔画”这类应用协助下创作完成。

另一个是美术设计相关产业的生产效率有望大幅提升。做美术设计的相关人士可以借助“AI简笔画”大幅提高工作效率,比如影视剧电影行业的场地置景、美术设计、道具、服装乃至导演,都可以通过AI简笔画快速生成“模拟图”提高沟通效率。3D打印大幅提升了制造等行业的设计效率,“AI简笔画”则有望提高艺术、工业设计、室内设计、服装设计、建筑园林设计、游戏互联网等等需要美术设计行业的产业效率。

总而言之,美图“AI简笔画”进一步打开了AI绘画的应用空间,从辅助美术教育,到助力AI绘画师、插画师等创作者再到提高设计影像数字产业的生产效率,AI绘画将加速商业化落地。

万亿商业市场待抢滩

机会只属于有准备的人

在千篇一律的“依托文字输入生成作品”的AI绘画类应用中,美图另辟蹊径推出“AI简笔画”,打开了AI绘画的全新可能。美图搞此类事情,应该说意料之中,因为AI绘画的底层技术,不论是机器图形学、机器视觉,还是如今的预训练大模型、生成式AI、AIGC,本质都还是AI技术,而美图确实在这些方面都有着一定的储备和积累。

美图的自我定位,是一家以美为核心,以人工智能为驱动的科技公司。2010年AI技术方兴未艾,当时美图已经成立美图影像研究院(MT Lab),致力于计算机视觉、深度学习、计算机图形学等人工智能(AI)相关领域的研发,以核心技术创新推动公司业务发展。包括近几年大环境不好,但从财报上看,美图的研发投入却持续增长,可见这家公司对AI技术拥有一定的热情。

AI技术也推动着美图的业务进展,其C端产品美图秀秀、美颜相机、Wink等底层都是视觉AI技术,旗下多款产品霸榜相关赛道,与美图的AI技术不无关系。比如 AI技术帮助美图秀秀的美颜效果更加自然,更早早实现了视频美化、牙齿矫正、五官重塑等创新功能。

正因为有深厚的AI技术积累、可供技术锤炼的业务场景以及海量的真实影像案例,让美图在去年就早早推出了“AI绘画”“百变AI头像”等功能,并在今年发布“AI简笔画”,再度引领AI绘画的发展。

如今预训练大模型驱动AI技术进入到全新阶段,强AI时代来临,认知智能超过感知智能成为主流趋势,美图也有望迎来新的发展机遇。

一方面,美图C端产品可借助“AI简笔画”这类杀手锏功能获得增长,核心功能如美颜等可基于“AI简笔画”底层的大模型技术强化升级,美图也有机会孵化出新的爆款产品;另一方面,美图可基于“AI简笔画”以及底层技术扩张B端业务版图,如进入AI艺术教育、AI数字藏品、AI美术设计、AI视觉艺术等全新领域。

资本市场是诚实的,2023年刚过两个月,美图股价已累计上涨70%左右,市值更是创近两年新高。一个不容忽视的原因是,美图长期以来对于AI技术的积淀已进入“收获期”。

前不久,美图特别公告称:“2022年归母经调整利润净额将实现盈利,主要由于旗下由AIGC驱动的图像相关应用程式的VIP订阅业务的收入增长超50%。”

长期来看,资本市场看好美图还是因其在视觉类AIGC赛道有独特的站位。一方面,美图拥有视觉类AIGC应用落地的最佳场景。中信证券在近日发布的研究报告中指出,“ChatGPT有望率先落地AIGC领域,推动AI领域公司商业化进程加速,打开新的市场空间。”而美图在C端/B端均有大量的AIGC落地场景,据公开信息,除“AI绘画”“百变AI头像”这类to C的功能外,美图推出的数款B端SaaS工具也将AI技术应用其中,如美图云修与美图宜肤。

另一方面,美图商业模式与AIGC未来的商业化有很强的结合点,东方证券在研报中表示,“随着ChatGPT开启付费订阅试点,AIGC的商业化进程正式拉开帷幕。”而订阅恰好是美图的核心营收模式,2022年上半年,美图VIP订阅业务收入3.392亿元,同比增长61.4%,正式超越在线广告业务,成为公司最大的收入来源。

据腾讯研究院发布的AIGC发展趋势报告,预计2030 年AIGC 市场规模将达1100 亿美元。巨大的蛋糕让各路玩家蜂拥而至。CB Insights数据显示,近几年,全球AIGC行业整体投融资事件数和金额呈快速上升趋势,2022年全球至少有110笔超过26.5亿美元的资金进入,仅仅是在中国就有100+企业布局类ChatGPT业务,但其中真正“能打的”很少,特别是在视觉AIGC领域。

国外谷歌发布了Imagen和Parti,Facebook发布了Make-A-Scene,而国内具有自主技术的玩家只有百度和美图,但两者的场景有着很强的差异化,前者是图片搜索,后者则主攻影像、设计等领域,因此美图也不需担心巨头的竞争,事实上,依托美图秀秀等大众消费级影像产品,美图的AI绘画在C端的普及度也要高出很多,很多中国用户人生第一次体验影像AI产品都是在美图秀秀。

技术浪潮带来的机会所有人都能看到,但能否摘得果子是另一回事。在AIGC以及预训练大模型这样的高门槛技术浪潮前,只有少数提前布局、持续投入、专注深耕的玩家拥有机会。在视觉类AIGC赛道,美图公司确实值得期待。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1