作者:于惠如编辑:刘宇
图片来源:由无界 AI生成
技术门槛降低催生了大量AI绘画创业公司,这同时意味着激烈的竞争,对此,身处其中的无界AI有切身感受。
目前,无界AI用户量不到300万,距离1000万的年度目标还有差距。无界AI创始人长铗直言,用户增长进入爬坡期,下半年还要继续努力。无界AI增长乏力是行业的一个缩影。
作为新兴领域,AI绘画行业正在快速发生变化。一周前的世界人工智能大会上,阿里云旗下通义系列大模型上新了一位新成员——通义万相,定位为AI绘画创作大模型。阿里之外,百度、讯飞、商汤等公司推出的大模型均具备文生图等多模态功能。
这意味着,AI绘画领域的基础设施越来越普及。事实上,在Stable Diffusion模型开源后,文生图生意的门槛降低了很多,中国诞生了大量的AI绘画创业公司。无界AI就是在这轮浪潮中成长起来的创业公司,从“社区即服务”的模式起步,在社群运营中一步步迭代优化。
竞争正在变得越来越激烈。今年3月底,随着业内最流行的AI绘画公司Midjourney 发布V5版本,将写实风图像的生成效果迭代到“照片级”。AI绘画领域敲响了生存之战。
AI 绘画的前景极具吸引力。据国泰君安研报预计,至2025 年,AI 绘画在图像内容生成领域渗透率将达到 30%,市场规模超 2000 亿元。
诱惑与挑战并行,唯能者居上。作为连续三届获中国科幻“银河奖”的科幻作家,长铗的真实名字叫刘志鹏,他将如何带领无界AI杀出重围?他的回答是:“在AI生成领域,国内创业公司的机会更多会出现在应用层。”
以下为全天候科技与长铗的对话内容,经全天候科技整理:
“AI绘画的应用目前仍集中在营销领域”
全天候科技:你们目前有多少用户?
长铗:我们用户量现在接近300万。我们没有做小程序,主要以APP用户为主,网站用户为辅。本来我们今年的目标是把用户做到1000万,但这几个月进入了爬坡期,用户数据增长没有AIGC刚火的时候快,离1000万的目标还有距离,下半年还要继续努力。
全天候科技:付费用户能占到多少?
长铗:C端是20%。我们每天针对每个用户有15次的免费作画额度,有很多用户是奔着每天的免费额度来的,我们也欢迎。对于C端,我们更多希望建立无界的行业影响力。营收主要还是靠To B这块。
全天候科技:今年上半年,诸多有实力的大厂入局 AI生成领域,给你们带来了哪些压力?
长铗:我们没有把它视作压力,大家的打法不太一样,定位也不太一样。大厂的AI绘画工具,一般是一种自成体系的定位,并没有与以SD(Stable Diffusion)为代表的开放社区打通,提示次、莫从参数都不兼容;第二,这些平台的绘画工具大多服务于自身比较知名的产品,比如美图侧重于AI在修图方面的应用。总体来说,它们更偏向于在某一个方向发力。
而无界立足于社区,方向多元,产品“像水一样自由流动”,流向具有商业潜力的领域,比如建筑设计、室内设计、服装设计、漫画、游戏等领域。在各个具有爆发力的垂直行业,无界都会与一两个头部B端客户合作研发行业模型,行业模型可能是下半年AIGC兵家必争之地,单一通用模型很难成为垂直行业的统一解决方案。
全天候科技:你们的B端客户有地产公司、文旅集团、还有消费品企业,行业跨度较大。挑选这些行业客户的逻辑是什么?只要赚钱就行?
长铗:对,有一些活动性质的,它们只是来征集一些优秀的作品,不涉及到具体产品层面,这种我们基本上也没怎么选择,只要客户愿意来,我们都欢迎。从上半年来看,大部分行业客户的需求主要集中在营销活动上。
但是,最近两个月,MaaS方面的合作越来越多,比如在室内家装行业,我们与三维家、欧派都有模型训练合作。下半年,无界将发布建筑、室内、服装、纹样、汽车、工业等行业模型。
无界AI人物写真模型生成的任务图像
“AI绘画公司的壁垒是社区+产品力”
全天候科技:现在提到AI绘画,大家第一反应可能还是Midjourney,你认为Midjourney的护城河是什么?
长铗:Midjourney的护城河有两方面,庞大的社区、很强的产品力。Midjourney借助Discord社区持续迭代,作为一款适用于游戏玩家一体化语音和文字聊天软件,Discord平台的社交属性也让Midjourney抢占了更多的用户心智。它的产品具有很强的个性,已经形成了一个审美流派。相比之下,Stable Diffuion开源生态中的应用,因为‘百花齐放’,在产品上难以形成自己的个性。
无界虽然立足SD生态,但未来的团队与产品建设将越来越MJ化。产品上,今年下半年我们会陆续发布室内设计、建筑设计等行业模型,以及主攻国风、国潮、国漫的设计模型,让产品更符合中国用户审美。在体现中国艺术这方面,我相信无界会比Midjourney更好。
全天候科技:Disco diffusion、Stable diffusion等模型开源后,中国涌现出了很多AI绘画创业公司。有人评价,它们的模型、产品同质化严重。你怎么看?
长铗:目前确实存在这个问题,前段时间SD生态的火爆,主要得益于二次元社区为爱发电的社区驱动力,但这些模型大多是融合模型,缺少原创性,号称万物熔炉,所以从整体上看,产品同质化比较严重。社区模型的主题较为狭窄,多为美女,动漫,插画等常见主题,距离相对专业的垂直需求还比较远。Stable diffusion这些绘画模型不能直接商用,大家用的是它的底层技术,竞争力还是要看在垂直应用层面的创新。
全天候科技:AI绘画公司的壁垒应该是什么?
长铗:就无界而言,有两点:第一是社区,第二是产品竞争力。
与区块链等开放社区一样,AIGC其实是社区驱动的逻辑。社区用户主要分为两类,一类是模型训练师(俗称炼丹师),一类是提示次词工程师(俗称魔法师)。用户的自主性、原创性非常高,如果他们摸索出来的模型参数在其它平台没法复用,那么它的迁移成本必然会很高。除了绘画模型,无界也在训练自己的语言模型,当然是微调的绘画应用语言模型,会帮助用户撰写提示词,帮助炼丹师给图片打标签,以及把自然语言转化为SD绘画模型能理解的标签式语言,我们也会把它开源,让社区免费使用。
“下半年AI绘画领域融资情况会改观”
全天候科技:从去年下半年开始AI绘画领域非常火爆,但目前融到资的企业却不多,你认为是什么原因?
长铗:我个人感觉,今年上半年,投资人的注意力主要在大语言模型这一块。偏技术驱动的这一波浪潮,投资人还是倾向于投底层逻辑是技术驱动的企业。对于偏应用层的项目,投资人更关注“你有哪些大客户?怎么盈利?财务数据怎么样?”这些务实的问题。但现阶段大部分的AIGC应用层企业还在拓展期,营收数据肯定不那么好看。到今年下半年,大家的情况应该会有好转,融资的情况也会有所改观。
全天候科技:目前你们的融资进展如何?
长铗:我们对这个事情比较佛系,我觉得融资是一件水到自然成的事,所以我们没有四处去找资本,主要精力还是放在产品和运营上。
全天候科技:你认为无界的产品力达到什么水平,或者用户达到什么规模,就该主动推进融资了?
长铗:在融资上,我们其实没有阶段性目标,如果资本找上来想投资我们,我们随时都欢迎,没有的话也不强求。但业务目标,我们是有的,而且压力还比较大,今年我们想实现一亿元的营收和1000万的用户。
全天候科技:目前营收能达到多少?
长铗:离目标还有一定的差距,后半年的压力还是比较大的,就看增长曲线,不过我们对未来还是保持乐观的态度。
全天候科技:AI绘画从诞生那天起,就存在着版权争议问题,你们怎么规避这方面的问题?
长铗:我们也专门研究过版权认定这个问题。去年,大家都说 AI是缝合怪、拼切怪、粘贴怪、精切怪之类的,早期确实存在这样的问题。但随着 AI的发展,它的艺术创造力越来越高,现在基本上不存在一幅AI作品像某个艺术家作品的可能了,因为现在的模型都是融合模型,融合了多种艺术流派、艺术风格,而不是学习一两位艺术家。
另外,对于绘画而言,重要的是图画内容的原创性,而不是工具。随着controlnet、segment anything、dragan等技术的应用,用户对AI生成图片控制度越来越高,可以像PS一样对图片进行分割、拖动、扭曲变形,用户输入的信息不再是单一的提示词,还有模型参数的精心搭配,有深度、动作姿态、线稿、轮廓等外部信息的应用,这意味着用户的原创性越来越高。另外,我个人认为,随着AI的发展,将来AI作品也肯定是具有版权的。