今天分享的是AIGC系列深度研究报告:《AIGC专题:AIGC内容生成深度产业报告》。
(报告出品方:量子位智库)
报告共计:34页
海量/完整电子版/报告下载方式:公众号《人工智能学派》
AIGC全称为AI-Generated Content,指基于生成对抗网络GAN、大型预训练模型等人工智能技术,通过已有数 据寻找规律,并通过适当的泛化能力生成相关内容的技术。与之相类似的概念还包括Synthetic media,合成式媒 体,主要指基于AI生成的文字、图像、音频等。
一方面,这一概念忽略了跨模态生成(如基于文本生成图像或基于文本生成视频)这一愈加重要的AIGC部分。我们 会在下一部分对跨模态生成进行重点讲解。另一方面,在结合现有技术能力和落地场景进行分析后,我们认为“生 成”和“内容”都应该采取更为广泛的概念。例如,生成中可以包含基于线索的部分生成、完全自主生成和基于底 稿的优化生成。内容方面,不仅包括常见的图像、文本、音频等外显性内容,同样也包括策略、剧情、训练数据等 内在逻辑内容。
从特定角度来看,AI内容生成意味着AI开始在现实内容中承担新的角色,从“观察、预测”拓展到“直接生成、决 策”。
从商业模式来看,我们认为,AIGC本质上是一种AI赋能技术,能够通过其高通量、低门槛、高自由度的生成能力广 泛服务于各类内容的相关场景及生产者。因此,我们不会将其定义为PGC\UGC之后的新内容创作模式,而是认为 其在商业模式上会有大量其他交叉。我们会在价值篇对其商业模式进行进一步展开。
技术视角下,我们认为以下场景将成为未来发展的重点:文本-图像-视频的跨模态生成、2D到3D生成、多模态理解 结合生成。后文将对以上技术场景的技术原理、现有进展、关键瓶颈等进行展开。商业视角下我们认为,未来3年内,虚拟人生成和游戏AI这两种综合性的AIGC场景将趋于商业化成熟。
文本生成
以结构性新闻撰写、内容续写、诗词创作等细分功能为代表,基于NLP技术的文本生成可以算作是AIGC中发展最早 的一部分技术,也已经在新闻报道、对话机器人等应用场景中大范围商业落地。
音频及文字—音频生成
整体而言,此类技术可应用于流行歌曲、乐曲、有声书的内容创作,以及视频、游戏、影视等领域的配乐创作,大大降 低音乐版权的采购成本。我们目前最为看好的场景是自动生成实时配乐、语音克隆以及心理安抚等功能性音乐的自动生 成。
视频生成
量子位智库认为,视频生成将成为近期跨模态生成领域的中高潜力场景。其背后逻辑是不同技术带来的主流内容形 式的变化。本部分主要包括视频属性编辑、视频自动剪辑、视频部分编辑。
GameAI
以腾讯AI Lab在游戏制作领域的布局为例,人工智能在游戏前期制作、游戏中运营的体验及运营优化、游戏周边内 容制作的全流程中均有应用。
虚拟人生成
虚拟数字人指存在于非物理世界(如图片、视频、直播、一体服务机、VR)中,并具有多重人类特征的综合产物。目前“深度合成+计算驱动”型的虚拟人,综合运用文本、图像、音频等生成技术,打造综合外观、面部表情、发 声习惯等产出全面拟人化的数字内容,属于AIGC领域。此种多模态生成技术的聚合应用在虚拟偶像、虚拟主播等 领域已有广泛应用。
在回答AIGC的价值之前,我们需要对AIGC本身的独特性做出回答。在量子位智库看来,用AI进行内容创作的价值主要 来源于五点。区别于市场观点,我们认为最后一点,也即与AI系统的个性化、实时化互动最能体现其潜在价值。尽管 目前AIGC尚无法完成精准可控的生成,但我们相信这一赛道未来的技术与市场规模上限。
总体而言,我们将AIGC产业划分为内容领域和延展领域。内容领域是目前已经能够、但并未有效实现商业化的领域, 预估未来1-2年之内会有相对完整的产业生态发展。而延展领域,由于对AI生成的自由度和稳定性有更高的技术要求, 在国内的应用落地相对内容领域会更晚。分析师认为,由于能够更加充分体现AIGC系统联动及要素拆解两大关键优势, 延展领域后期将成为AIGC创造价值的主阵地,提供AIGC的想象空间天花板。
由于AIGC目前产业化程度有限,大量业务场景尚未成功变现,我们目前尚无法对市场规模进行精准测算。在参考相关 创作软件、已有成功商业化案例、AIGC预估功能等因素的基础上,我们对各细分场景的商业化潜力进行了如下估算。
经过对比,我们发现中外公司间存在明显差异,整体差距大约在3年左右,底层技术差距是核心原因。整体上,更为常见的是研究机构对AIGC能力进行理论研究,实际效果开发较少。同时,TTS等 较为成熟的AIGC能力大多被综合性的AI公司打包提供,在应用场景上缺乏明确的指向性。其次,在分布场景上有阶段性差异。在国内,布局最多的赛道是AI写作和语音合成领域,虚拟人赛道刚刚开始兴起, 基本均停留在内容领域。而在国外延展领域得到了更为充分的挖掘,例如个性化文本生成、合成数据等赛道均是重点布 局领域。技术部分导致了这一原因,但分析师认为,更大的原因在于此类业务拓展的综合性要求较高,需要客户方的数字化程 度以及对对应行业的充分了解,预计国内外在这两个赛道上存在2-3年差距。最后,我国的AIGC行业尚未建立起明确的变现方式。以写作机器人、自动配音等场景为例,大部分产品仍处在免费试 用的“流量吸引+平台改良”阶段,收费空间相对较小。此外,多家公司提及,由于服务B端客户时话语权较弱,会考 虑向2B2C领域、乃至直接2C领域延展。但作为工具,能否在互联网流量相对稳定的前提下有效接触C端用户,设计 好产品转化路径,依旧是一项挑战。从竞争方面来看,与具有渠道优势的大型平台竞争成为一项关键点。
报告共计:34页
海量/完整电子版/报告下载方式:公众号《人工智能学派》