原创 | 文 BFT机器人
电子:AIGC 带动算力需求爆发, AI 芯片迎来高速成长期
AIGC 模型预训练数据量呈指数级增长, 带动算力需求爆发。从 GPT-1 到 GPT-3,模型参数量从GPT的1.17亿增加到 GPT-2的15亿,再到GPT-3的1750亿:训练数据量也由GPT的5GB,增加到 GPT-2的40GB,再到 GPT-3的45TB。AIGC 模型预训练数据量呈指数级增长,带动算力需求爆发。
云边端算力协同融合,有望满足不同应用需求并提升算力效率。
人工智能在云端、边缘端、终端都有广泛应用, 对算力有不同需求。云端具有海量数据处理与计算能力, 可以承载云端训练和推理的任务:将算力从云端向边缘侧扩展,支持在网络边缘执行深度学习、强化学习等人工智能算法,避免计算任务从网络边缘传输到云中心的超长网络传输延迟,可以满足高实时性应用的需求; 通过算力前置实现终端分布式算力与云端中心算力的动态平衡,可以大幅提升算力效率。通过云边端算力协同融合, 有望满足不同应用需求, 并提升算力效率。
算力基础设施云、边、端 AI 芯片作为算力载体,将迎来高速成长期。
人工智能的各类应用场景,从云端溢出到边缘端, 或下沉到终端,都离不开智能芯片对于“训练”与“推理任务的高效支撑,算力基础设施云、边、端 A 芯片作为算力载体, 将迎来高速成长期。
云、边、 端三种场景对于智能芯片的运算能力和功耗等特性有着不同要求, 云端承载处理海量数据和计算任务,需要高性能、高计算密度,典型计算能力一般要大于 30TOPS; 终端对低功耗、高能效有更高要求, 典型计算能力一般小于8TOPS,典型功耗一般小于 5 瓦: 边缘端对功耗、性能的要求通常介于终端与云端之间。
3.1 AI大模型生产海量算力需求,驱动云端AI芯片快速成长
大模型及人工智能在多场景广泛、深入应用, 驱动智能算力规模高速增长。
AI 大模型训练和推理过程消耗海量算力,带动算力需求爆发式的增长,以及人工智能在智慧交通、智慧金融、生物识别、智能制造、智慧医疗、自动驾驶等场景的广泛、深入应用, 中国智能算力规模将持续高速增长。根据 IDC 的数据, 2021 年智能算力规模为 155.2 百亿亿次/秒(EFLOPS)2022 年智能算力规模达到 268 百亿亿次/秒(EFLOPS),预计 2022-2026 年中国智能算力规模的年复合增长率将达 52.3%,同期通用算力规模复合增速为 18.5%。
AI 服务器专为人工智能训练和推理应用而设计,大模型有望推动 AI 服务器市场加速成长。
服务器一般可分为通用服务器、云计算服务器、边缘服务器、 AI 服务器等类型,AI 服务器专为人工智能训练和推理应用而设计, 大模型带来算力的巨量需求,有望进一步推动 AI 服务器市场的增长。根据 IDC 的数据,2020 年全球 A1服务器市场规模为 112 亿美元, 2025 年预计全球人工智能服务器市场规模将达到 266 亿美元,五年复合增长率为 18.9%。根据 IDC的数据,2020 年中国 Al 服务器市场规模将为35 亿美元, 2025 年预计中国 AI 服务器市场规模将达到 108.6 亿美元, 五年复合增长率为 25.3%。
AI 芯片占 AI 服务器成本主要部分。CPU+GPU 是目前 AI 服务器主流的异构计算系统方推理型和机器学习型服务器中CPU+GPU 成本占案,根据 IDC 2018 年服务器成本构成的数据,比达到 50-82.6%,其中机器学习型服务器 GPU 成本占比达到 72.8%。
AI 芯片以GPU为主,NPU成长迅速。
Al 芯片主要包括 GPU、NPU、FPGA、专用集成电路等,根据的 IDC 数据,2021 年中国人工智能芯片中,GPU 依然是实现云端数据中心加速的首选, 占据 89%的市场份额,GPU 芯片多用于图形图像处理、复杂的数学计算等场景,可较好地支持高度并行的工作负载,常用于云端的 AI 模型训练,也可应用于边缘端和终端的推理工作载: NPU 占据 9.6%的市场份额,NPU 增速较快, NPU 芯片设计逻辑更为简单,常用于云端、边缘端和终端的模型推理,并生成结果, 在处理推理工作负载时, 能显著的节约功耗; 而ASIC 和 FPGA 占比较小, 市场份额分别为 1%和 0.4%。
AI 芯片是 A1服务器算力的核心组成,有望畅享 AI 算力需求爆发浪潮。
AI 芯片是 AI服务器算力的核心组成,随着 AI 算力规模的快速增长将催生更大的 AI 芯片需求。根据亿欧智库的数据,预计 2022 年中国人工智能芯片市场规模为 850 亿元, 2023 年中国人工智能芯片市场规模将达到 1039 亿元, 2025 年中国人工智能芯片市场规模将达到 1780 亿元。
英伟达主导云端 AI 计算市场,国内企业加速发展。
在云端智能计算市场,主流的芯片和加速卡方案提供商主要包括英伟达、寒武纪和华为海思等。由于软件生态优势,英伟达的 GPU芯片和加速卡产品占据大部分市场份额。国内寒武纪、华为海思等企业市场份额相比于英伟达均较小,但处于加速发展中。
据 Liftr lnsights 数据, 目前在 A 技术进展最为前沿的北美数据中心 A 芯片市场, 英伟达市场份额占比超过 80%,且在训练、推理环节均保持持续领先:在数据中心 AI 加速市场, 2022 年英伟达市场份额达 82%,AWS 和 Xilinx 分别占比8%、4%,AMD、 Intel、Google 均占比 2%。
美国限制高端 GPU 供应,国产 GPU 芯片厂商迎来黄金发展期。
2022 年 8 月31 日英伟、AMD 生产的 GPU 产品被美国列入限制范围,英伟达被限制的产品包括 A100 和 H100,AMD受管制 GPU 产品包括 M1100 和 M1200 系列。海光 DCU 属于 GPGPU 的一种,在典型应用场景下海光深算一号指标达到国际上同类型高端产品的水平,在海外监管趋严的背景下。以海光为代表的国产 GPU 厂商迎来黄金发展期。
AI 芯片专用于人工智能领域,国产 AI 芯片厂商迎来高速发展期。
AI 芯片是专门针对人工智能领域设计的芯片, 其架构和指令集针对人工智能领域中的各类算法和应用作了专门优化,可高效支持视觉、语音、自然语言处理和传统机器学习等智能处理任务。在人工智能领域, AI 芯片的优势明显,可以替代 CPU、 GPU 等传统芯片。国内 AI 芯片以寒武纪思元系列、华为异腾系列等为代表,寒武纪和华为异腾部分 AI 芯片产品性能已达到较高水平, 有望加速实现国产替代,迎来高速发展期。
3.2 AI技术推动算力需求从云端向边缘延伸,带动边缘段智能芯片稳步增长
边缘人工智能解决实时性、安全性需求。
边缘计算是在靠近物或数据源头的网络边缘侧,融合网络、计算、存储、应用核心能力的分布式开放平台,就近提供边缘智能服务,满足行业数字化在敏捷连接、实时业务、数据优化、应用智能、安全与隐私保护等方面的关键需随着人工智能技术的发展, 越来越多的数据处理需求必须在边缘侧完成,例如工厂智能控求。制、智能家居、自动驾驶等。
这些场景往往需要很强的实时性,对延时敏感,并且有很强的数据隐私性要求, 相关生产数据不能上传到云端。边缘人工智能则很好地解决了这个需求,通过在产线等边缘处直接部暑智能计算设备, 在无需将数据传出工厂的同时,实时地进行数据处理并对产线进行决策和控制。
算力需求从云端向边缘延伸,带动边缘计算服务器和边缘端智能芯片稳步增长。
随着人工智能、5G、物联网等技术的逐渐成熟, 算力需求从云端不断延伸至边缘,带动边缘计算服务器和边缘端智能芯片市场稳步增长。
根据 IDC 的数据,预计 2022 年中国边缘计算服务器市场规模达到 42 7 亿美元, 同比增长 25.6%; 预计 2021-2026 年中国边缘计算服务器整体市场规模年复合增长率将达到 23.1%,高于全球的 22.2%。与云端智能芯片相比,边缘智能芯片的使用场景更加丰富,同时芯片售价并不昂贵。根据 ABI Research 预计, 边缘智能芯片市场规模将从 2019 年的26 亿美元增长到2024 年的76 亿美元。
国内边缘端智能芯片厂商崛起,部分产品性能指标已可对标海外龙头厂商。
在边缘场景下,运算量依然很大、多样化场景要求具备多种算法的兼容性,对边缘智能芯片的计算能力要求低于云端,但对成本控制和功耗则提出了更高的要求。
从市场认知度上看,英伟达的边缘计算芯片在全球范围内仍处于领先地位,但国内寒武纪、华为海思等厂商的边缘端智能芯片的性能指标与英伟达部分产品基本处于同一水平, 国内边缘智能芯片厂商主要包括有寒武纪、华为海思、 瑞芯微、北京君正、全志科技、紫光展锐、地平线、平头哥、九天赛芯、杭州国芯等。
3.3 A速IGC有望加智能在终端上的应用,终端AI芯片迎来升级与发展机遇
AIGC 应用领域广泛,插件有望推动AIGC 应用爆发。
AIGC 是一种利用 AI 技术自动生成内 容的生产方式, 包括文本、图片、视频等多种形式的内容,AIGC 可以应用在文本、代码、图 像、语音、视频、3D 模型、游戏、音乐、音频等领域。目前 ChatGPT 已支持插件功能, 首批 上架 11 个插件,包括旅行软件、数据提供商、视频创意平台、电商平台、配送服务等公司, 插件有望加速 AIGC 的应用爆发。
AIGC 有望成为物联网应用的重要助手,推动物联网行业快速发展。
物联网可以提供大规 模的数据,能一定程度上解决 AIGC 模型训练所需的数据来源;物联网技术能够实现对物理世 界的状态数据、定位数据、行为数据等采集, 在获得这些数据后, AIGC 模型能够更深入地学 习各行业具体场景知识, 输出更精准的信息, 为行业经营者提供参考, 加速产业数字化升级的步伐, 以及简化人们与智能家居、智能硬件交互的方式。AIGC 有望成为物联网应用的重要助 手,推动物联网行业快速发展。根据 IDC 的数据, 预计到2026 年中国物联网设备连接数总量 将达到 102.5 亿个, 2022-2026 复合增长率为 18%。
AIGC 有望加速智能在终端上的应用,终端 AI 芯片迎来升级与发展机遇。
随着 AI 技术在 手机、智能音箱、智能摄像头、无人机、自动驾驶汽车等终端上的应用,曾经很多人工智能的 推理工作, 诸如模式匹配、建模检测、分类、识别、检测等逐渐从云端转移到了终端侧,赋予 终端设备更多“智慧”。智能终端在不同应用场景下对算力、功耗、时延的多元化需求, 使得 人工智能芯片在端侧可以拥有更多元化的应用场景。
AIGC 有望进一步加速智能在终端上的应 用,终端 AI 芯片迎来升级与发展机遇。根据甲子光年的数据, 随着人工智能在终端的广泛应 用, 2018-2023 年中国终端 AI 芯片市场规模复合增速达到 62.2%,2023 年中国终端 AI 芯片市 场规模将超过 160 亿元。
传媒:AI赋能内容创作
以 AI 绘画工具 Midjourney 生成的画作《太空歌剧院》获美国科罗拉多州艺术博览会数字 艺术类别比赛冠军这一事件为催化剂, 自 2022 年开始,AIGC 技术走入大众视野,包括ChatGPT、Midjourney、Stable Diffusion、Adobe Firefly、Googe Bard 等 AIGC 相关的应用 产品及其迭代版本开始能够触达到 C 端的普通大众用户,与 AIGC 有关的内容在社交网站的讨论热度持续攀升,引发了较大范围的好奇与关注, AIGC 在 2022 年开始有明显的破圈迹象。
随 着 2023 年 GPT-4、Midjourney V5 等新一代 AI 技术及应用的再次迭代更新并表现出优异的内 容生成能力,AIGC 技术正在逐渐改变当前的内容生产模式,带来全新的变革。
4.1 AIGC:从感知理解内容到创造内容
AIGC (Artificial Intelligence Generated Content)或称生成式 AI (GenerativeAI)是将人工智能技术用于生产内容,是 AI技术从过去的被动分析到现在的主动创造的迭代。
早期的 AI 技术更偏向于数据的分析和总结,通过已知数据中提取出相应规律和模式并进行应用,其中最为广泛的用途就是个性化推荐算法;
而生成式 AI 并不仅仅分析已经存在的数据,而是通过学习大量的数据内容用以形成全新的数据,生成式 AI 实现了 AI 技术从感知理解内容到创造内容的进步。
从更宽泛的角度理解,AIGC 既可以指利用 AI 技术生成的文本、图像、音视频等创造性内容,也可以指用于内容自动化生产的一种技术合集,还可以指利用 AI 技术的一种新型内容生产方式。在当前阶段将 AIGC 看作一种新型的内容生产方式更符合普遍的认知。
中国信通院发布的《人工智能生产内容白皮书》表示, 目前国内产学研各界对于 AIGC 的理解也是 “继专业生成内容(PGC) 和用户生成内容(UGC) 之后,利用人工智能技术自动生成内容的新 型生产方式。”
根据 a16z,目前在内容生成领域可以分为 4 个不同的阶段,分别是专业生产内容(PGC)、用户生产内容(UGC)、 AI 辅助生成内容和进入完全阶段后的 AIGC。当前的时点正处于 PGC 较为成熟、UGC 蓬勃发展并即将进入大规模 AI辅助生成内容的初级阶段。
PGC内容通常由具备一定专业技能的团队操办,其专业化程度、创作门槛以及资源投入都比较高,普通人难以企及,同时创作出的内容质量也更好,但受制于较高的专业技术门槛、较长的创作周期和昂贵的制作成本,PGC 的参与者以及产出内容数量也相对有限,典型的 PGC 内容包括 3A 级别游戏大作、院线级别电影大片、电视综艺节目等。
而移动互联网和智能手机的普及大幅降低了内容创作的门槛和专业化要求,推动了 UGC 的快速发展,能够参与内容创作的 普通用户以及产出的内容数量急剧增加, 如抖音、快手、小红书、B 站等新型互联网内容平台中都拥有海量的用户和大量的 UGC 内容,但基于UGC模式下会根据内容生产者的所掌握的创作技能水平不同导致 UGC 内容的质量也参差不齐。
随着技术的进步,AIGC能够实现对PGC和UGC的赋能, 在PGC创作过程中代替部分人工工作, 有效实现创作效率的提升和创作成本的降低并逐渐拓展更多新的内容生产逻辑及形式; 在 UGC 领域则能够帮助提升内容创作的专业化水平,进一步降低内容创作的准入门槛, 提升输出内容的质量;在更加中长期的发展中, AI 的作用有望从内容生产的辅助性功能逐步过渡至完全由 AI 自主生产内容,从而进入真正的 AIGC 阶段,实现 AI 技术 24 小时不间断自动生产内容,内容供给实现大规模快速增长。
4.2 文字、图像生成日趋成熟,跨模态功能具备高潜力
在 AIGC 的产业生态体系中,可以分为基础层、中间层和应用层三层架构。
第一层为基础层,是整个AI 生态体系中十分重要的一层,主要是提供预训练模型, 是 AIC 技术的基础设施层,为中间层和应用层提供支持和保障,但由于预训练模型通常需要比较 高的技术投入和训练成本,因此具有一定的准入门槛。
目前头部的基础设施型的公司包括OpenAI、Stablilty.ai 等都属于基础层的主要参与者。第二层是中间层,是在预训练的大模型基础上针对部分垂直化、场景化、个性化的特定需求场景进行二次开发,实现 AI 在不同行业、不同垂直领域和不同应用场景中的定制化需求。例如同样基于 stable diffusion 开源模型训练的作图软件,Novel-AI 在生成的图像上就更加偏向于动漫、二次元风格。
第三层是应用层,在基础层和中间层的基础上,将 AI技术应用到实际的场景中, 帮助用 户解决各类问题和需求,实现 AIGC 技术的产业落地,例如面向 C 端用户的各类文字、图像、 音视频的生成服务等。
在内容生产的层面,
包括绘画、写作、音乐等内容的生产创作都属于创意性工作,以往被视为人类的专属技能和智能的体现,是无法被机器替代的部分,但在如今不断进步的 AI 模型、算法和数据面前,AIGC 已经开始越来越多地介入到数字内容生产的各个领域,担任画家、写手、作曲家、程序员等角色, 从事创意性的创造工作。
基于模态分类, 利用 AI 技术实现文本生成、音频生成、图像生成、视频生成、策略生成以及图像、视频、文本间的跨模态生成的功能都是当前和未来 AIGC 重要的技术落地场景,其中跨模态/多模态的内容生成将成为未来 AIGC 的关键发展节点。
从目前的效果来看,AIGC 在 生成文本、图像、语音等方面已经初步得到应用,效果也可达到比较令人满意的程度, 在视频、3D 等更加复杂的领域则还需要进行更多的探索和进步。
(1) 文本生成
以 OpenAI 旗下的 ChatGPT 为代表,在文本生成领域,AI 技术已经得到了比较广泛的应用,可以完成从互动型的人机交流对话到较为复杂的创作型文章的自动生成等工作。
由于应用型文本大多为结构化写作, 相对固定,难度较小,新闻稿件、公司财报、客服聊 天问答等都是比较典型的应用型文本,当前的 AI 技术在结构化写作上已经可以实现比较高的 完成度并实现商业化应用;创作型文本的写作则需要一定的创意和个性化,对于 AI 生成能力的要求更高。
例如营销文案、小说续写等都属于此类,目前 ChatGPT 已经可以满足一定程度的创作型文本生成的需求,但在长文本方面的生成能力仍待改进,未来有望实现突破;基于沉浸 式沟通社交的需求, 闲聊型的交互式文本生成有望在虚拟伴侣、心理咨询、游戏中的智能 NPC 等方面成为重要的应用场景。
(2) 音频生成
AI 技术在音频生成领域既可以实现从文字到语音的识别转化、语音的克隆 (TTS), 也可以用于歌曲、乐曲以及视频、游戏、影视等领域的配乐创意性创作以达到降低音乐版权采购成 本以及提高音乐制作效率的目的。
TTS (Text-to-speech)在 AI 语音生成领域已经进入相对成熟的阶段,被广泛应用于客服 机器人、有声读物制作、新闻语音播报、短视频配音等各类场景, 其核心原理是通过 AI技术
自动将文字信息进行提取并转化为语音。此外,AI 在 TTS 领域已经发展出了语音克隆技术, 可以理解为通过 AI技术来模仿某个特定发言人的音色、音调以及说话方式等要素, 并结合给定的文字或语音内容合成一段全新的语音,语音克隆技术可以用于虚拟歌手演唱、自动配音等 领域。
在音乐内容的创作上,AIGC 可以拆分为作词、作曲、编曲、人声录制和整体混音。目前 AIGC 已经可以实现基于开头旋律、图片、文字描述、音乐类型、情感类型等信息生成特定的 乐曲或音效。
其中 AI 作曲以语言模型为中介,对音乐数据进行双向转化;AI 编曲基于主旋律 和创作者的个人偏好,生成不同乐器的对应和弦,完成整体编配。
(3) 图片生成
AI 在图片生成领域的技术场景可以分为图像属性编辑、图像局部生成及更改、端到端的图像生成。
图像属性编辑技术包括了图片去水印、自动调整光影、设置滤镜等功能;图像局部生成及更改则能够更改图像的部分构成、例如修改面部表情、局部换脸等,图像属性编辑和图像局部 生产与修改可以被看作以 AI 处理的低门槛方式一定程度上实现 PhotoShop 的功能。
图像端到端生成对应创意性图像生成以及功能性图像生成两大应用场景,能够实现基于草图生成完整图像、有机组合多张图像生成新图像、根据指定属性生成目标图像等需求。目前 Midjourney、 文心一格、 DALL ·E2、Stable Diffusion 等产品都能够以比较高的质量实现图像的生成。
(4) 视频生成
AI 技术在视频生成领域的使用主要集中在视频属性编辑、视频自动剪辑和视频部分生成 3 个领域,
视频属性编辑主要在画质修复、删除特定主体、增加特定内容等方面,通过 AI 的方式代替大量人工操作环节, 目前已经实现相对广泛的应用,视频自动剪辑和视频部分生成对 AI 的智能化要求更高, 因此还处于技术拓展的阶段。
虽然目前 AI 技术在视频生成领域的技术还远未达到成熟的地步,难以发挥理想中的效果,但基于目前互联网上长视频和短视频内容数量的急剧膨胀,视频内容生成的需求将会大幅 提升,未来 AI 技术进步后视频生成有望成为 AIGC 的高潜力场景。
(5) 跨模态生成
AIGC 本质是一种利用 AI 技术实现高效便捷的内容生产方式, 按照生成内容的模态来划分, AI 已经能够不同程度地在文字、图像、音频、视频等多个领域实现内容生成。
基于对未来 AIGC 技术易用性以及内容生产的丰富性的需求,单一模态的内容生产方式已经难以满足多 元化内容的生成需求,因此对于从文字、图像、音频、视频等多个不同模态之间的互相转化和生成的需求不断提升,进一步催生内容的生产方式的变革,拓展 AIGC 内容生产的边界,实现 AIGC 从“能用”进化到“好用”。
为了更加接近人类的多模态能力,大型预训练模型的发展重点也开始向横跨文本、图像、 语音、视频的全模态通用模型发展并成为主要趋势。
在跨模态领域,“文字-图像”的跨模态生成正在快速发展并进入较为成熟的阶段, 通过输入风格、色彩、内容元素等关键字就可以得到
相应的图像,MidJourney V5、Stable Diffusion 等 AI 绘图产品已经可以以比较高的质量实现文字到图片的生成;“文字-视频”可以被看作“文字-图像”的进阶技术,通过关联文本和图像生成,逐帧生成所需的图片,最后进行组合生成完整的视频, 但由于视频生成需要面临不同帧之间的连续性问题, 需要确保视频整体的连贯流畅, 因此技术要求也更高。
目前基于文字搜索合适的配图、音乐等素材在已有模板下完成自动剪辑的“拼凑式生成”已经进入商用阶段 并存在较为成熟的产品, 但不直接引用现有素材, 只基于 AI 模型自身能力的 “完全从头生成”还处于技术尝试阶段,生成的视频时长、清晰度、逻辑程度等还有比较大的提升空间。
4.3 商业变现路径日趋清晰,市场规模有望快速增长
AIGC 在文字、代码、图片的生成领域已经进入相对成熟阶段并能够实现一定程度的规模 化内容产出的背景下,AI 技术的商业化路径和变现模式也日益清晰。
目前的 AIGC 下几种主流 的商业模式分别是 MaaS、根据产出数量收费、订阅收费等:
MaaS (Model as a Services):拥有预训练模型的大型公司对外开放 API接口,基于模型 的调用量进行收费,适合底层大模型和中间层进行商业化变现。例如 OpenAI 允许第三方通过 API 将 ChatGPT 集成到第三方的应用程序和服务中心之中,定价为 0.002 美元/750 字。
根据内容产出数量计费:向用户提供内容生成服务,按照生成的内容数量进行收费。例如 DALL ·E、Midjourney 等绘图软件会按照图片产出的张数进行收费。
订阅制:类似于流媒体平台,用户按月支付费用获取基本服务或增值服务。例如 ChatGPT 会向ChatGPT Plus 用户收取 20 美元/月的订阅费, 付费订阅的用户能够享受更快的响应速 度、高峰时期的使用权限以及优先享受新功能等附加服务。
根据量子位测算,2023 年国内AIGC 市场规模预计可达到 170 亿元, 自2025 年开始, 随着产业生态越发完善,应用层将会蓬勃发展并带动产业快速增长, 自 2028 年开始, AIGC 将延 展出完整的产业链并持续拓宽拓深商业化场景,预计到 2030 年市场规模有望超过万亿元。
4.4 AIGC有望带来内容产业的降本增效和模式创新
传媒行业本质是一个内容型产业,尤为注重内容的生产创作。
对于传媒产业下的游戏、影视、广告营销等细分领域来说,生产的内容即是产品,内容供给端的丰富性会在较大程度上影 响用户的需求,并且技术的进步也会催生更多对于内容的需求。因此,能够降低内容生产的门 槛和成本、提高内容生产的效率和质量的AIGC 也将率先在传媒领域得到比较广泛的重视和应用。
短期来看, AIGC 所带来的文本生成、音频生成、图像生成、视频生成以及跨模态生成等 多个应用功能都能够在游戏、广告、影视等多个传媒细分领域得到比较好的体现, 为传媒产业 持续赋能。AIGC 目前在传媒领域的应用短期将体现在两大通用功能:(1) 作为内容辅助生产 工具,在内容创作过程中实现降本增效;(2)利用 AIGC 技术实现内容产品质量和使用体验的 提升。
(1) AIGC+游戏
游戏产业从研发到发行环节涉及的内容创作环节数量众多,流程复杂, 从产业链来看, 游戏的研发过程中包含了人物设定、剧情设计、美术绘画、程序代码、音乐音效、 3D 建模等大量的内容要素, 在游戏发行过程中也包含了营销素材制作、广告投放策略等环节。
在玩家公认的质量上乘的 3A (3A 为 A lot of money、A lot of time、A lot of resources)级别游戏研发过程中,存在“成本、质量和速度”的不可能三角,质量的保障伴 随高昂的成本和大量的研发时间,因此游戏产业对内容创作环节的降本增效需求也十分强烈。AIGC 技术所带来的内容创作模式变革将打破人力生产内容的产能天花板,提升研发过程中内容产出的效率和发行的效率,在保障内容产品质量甚至进一步提升质量的同时还能够使研发和 发行成本下降。
在研发阶段, 目前文字生成领域的代表性产品 ChatGPT 已经可以实现创作型文本的生成到 代码编写工作, 通过创作型文本的生成可以为游戏的世界观、角色设定、剧情设计提供创意思路,策划人员也可以基于AI生成的文本内容进行二次加工,节省构思时间;同时ChatGPT还具有编程能力,能够根据需求生成代码,替代部分程序员的基础代码编写工作。在美术阶段,
目前有 Stable Diffusion、Midjourney 等产品能够实现文字到图像的跨模态生成,依据给定 的 prompt 指令快速生成不同要素、不同风格的图片,将概念性的文字转化为可视化的图像, 提高策划和美术之间的沟通效率或直接用于游戏之中。
此外 AI 也能够实现从线稿草图到完整 图像的快速生成、绘图风格的快速切换等功能,节约大量的绘画美术工作的时间。在配乐阶段,AI 能够根据游戏风格和背景设定快速生成大量与游戏调性相符的音乐和音效供选择,降低游戏研发过程中音乐方面的制作成本。
在对游戏可玩性的提升方面,AI 可以基于特定的场景和问题, 自主提出解决方案,生成 游戏操作策略, 可以用于注重对抗类的游戏产品。
例如 Deepmind 的 AlphaGO 在围棋领域就展 现出了十分强大的策略生成能力,能够战胜大量国内外顶尖棋手。
在以《英雄联盟》为代表的 MOBA 类游戏以 《星际争霸》为代表的 RTS 类游戏中,AI 的决策生成能力也能够得到比较好的应用,由于这类游戏机制复杂, 十分考验临场反应、战略战术和玩家操作, AI 能够通过强化 学习的方法模仿真实玩家,包括发育、运营、协作等指标,以及 APM、技能释放频率、命中 率、击杀数等具体参数,使 AI 更加接近玩家的真实表现,丰富 MOBA 类和 RTS 类游戏的可玩度 和对战的真实感。
另一种能够将 AI 和游戏内容进行有效结合的方式是打造智能 NPC (非玩家角色)以提升游戏体验。
在以往的游戏中, NPC 的所有行为逻辑是基于游戏策划的设定驱动,虽然 NPC 也能够根据玩家的不同选择做出不同的行为, 但依然无法做到脱离原本设定的分支树实现更加自由的交互。
在接入AI后,由 AI 来驱动 NPC 的行为和逻辑,使 NPC 能够基于自己的理解对玩家的操作和文字交互行为产生反映, 智能化程度得到较大程度的提升, 一改以往游戏模式下 NPC 只 能根据系统设定的固定路径与玩家进行交互。
通过 AI赋能能够在游戏世界中构建几乎无限且 不重复的剧情,达到 NPC 的 “千人千面”,实现完全的开放世界,丰富用户的游戏体验和自由度,增加游戏整体叙事的可能性。
(2) AIGC+广告营销
广告营销领域的工作涉及数据资料收集和处理、宣传文案的撰写、宣传内容的制作、投放渠道的管理与效果分析等工作, 需要消耗大量的时间,其中有较多的工作都可以通过 AI 代替 人工的方式实现效率的提升。
在前期的数据收集和处理方面,AI 可以实现数据的获取、 整合和分析的全过程参与,AI 能够在社交媒体、搜索引擎、新闻网站等平台自动抓取数据并将数据进行整合、优化和分析, 帮助广告主更好地了解当前的市场趋势、竞争情况以及受众群体的偏好并制定相应的广告投放策略, 同时 AI 还能够基于数据分析的结果和加上模型训练对广告投放策略进行模拟,对转化率、点击量、ROI 等指标进行预测并根据预测结果实时优化投放策略并反馈给广告主和营销策划机构。
在文案撰写方面,与游戏策划类似, AIGC 也可以在文本生成上实现创意性的广告文案创作、品牌营销软文以及相关的拍摄脚本思路的生成,能够降低广告文案的创作门槛,节约策划和文案创作的时间,提升效率。
另外在 AIGC 的图像生成功能也可以用于一部分的广告内容制作。以服装展示为例, 传统 模式下的服装展示需要聘请专业的模特、摄影师、灯光师和后期修图人员,花费较高的时间成 本和金钱成本;
但通过 AI 生成的模特同样可以达到展示服装的效果,并且 AI 模特也可以根据目标消费者的年龄、 体型、脸型、肤色、发色、服装搭配等不同情况进行动态调整并生成出多 类型的效果展示图, 相比使用真人模特来说成本更低,效率更高并且能够更加多样化展示。
当技术不断进步, AI 模特图也会不断优化,在展现效果上也将会越来越接近真人实拍,实现广 告内容制作领域的降本增效和转化率的提升。
(3) AIGC+影视
影视行业产业链中包含了上游的剧本创作、中游的影视内容拍摄、后期制作、宣发以及下游的播放环节。其中 AIGC 技术能够在在上游的影视剧本创作和中游的影视内容拍摄与后期制作领域进行深度参与。
在剧本创作方面,目前的影视剧本创作高度依赖编剧团队,导致剧本的撰写速度和质量会 受编剧团队的灵感、状态等不确定性因素的影响。
与游戏策划、广告文案撰写类似,AIGC 在 文本生成领域可以高度参与剧本创作,根据主题或情节梗概自动生成相关的剧本构思大纲和创意内容甚至完全独立撰写剧本, 在短时间内给作者和编剧提供不同的想法和思路, 也能够基于特定的需求帮助编剧修正和优化剧本,使剧本的语言和剧情的推进更加流畅,缩短剧本的创作 周期, 增加剧本产出的稳定性。
另外 AI 也能够通过分析大量影视戏剧作品的表现及数据的方式获取市场和观众的偏好, 帮助剧本作者和制片方快速评估剧本的市场潜力, 并根据市场偏好及时进行内容调整。
在影视拍摄和后期制作环节, AIGC 能够利用计算机视觉和机器学习等技术在一些恢宏场景下自动批量生成大量不同体态、不同表情、不同动作、不同着装的数字人演员来替代真人群演,实现数字演员“千人千面”。
另外在重要演员的场景方面, 通过 AI分析演员表情、语调、 表演的方式实现部分演员功能的替代,例如通过换脸的方式替代影视作品中部分劣迹艺人的戏 份,能够在不影响剧情表现的情况下降低艺人道德风险, 减少制片方损失;或者通过让 AI 学 习目标演员的职业生涯剧照及表演视频素材, 生成目标演员的数字人, 使已故的演员“复活” 或让演员实现屏幕中的增龄或减龄。
4.5 AIGC应用破圈,引发市场关注
目前的 AI 技术的应用已经从最初的数据分析突破到创意性内容的生成, 优秀的内容生成能力引发了大范围的关注,GPT-4、Midjourney 等 AIGC 类应用产品的快速迭代和更新表明了 AIGC 的发展已经步入快车道并正在为内容创作领域带来深刻的变革。
随着算法、模型、算力 的持续优化,未来的 AIGC 将实现更加高质量的内容产出, 当前技术成熟度相对欠缺的长文本 生产、视频生成以及横跨更多模态的多模态生成等方面也将逐一被突破、解决,进一步扩大AIGC 技术的应用范围和普及率。
在内容生产领域,AIGC 已经率先被应用于游戏、影视、新闻媒体、文学创作、音乐、广告等多个内容领域, AIGC带来的高效率创作能够帮助B端和C端的内容创作者降低创作门槛 和成本,提升内容创作效率并带来更多的商业化变现可能,未来的 AI 技术影响范围还将进一 步扩大,有望实现全行业的“AI+”。
报告出品:中原证券
报告编辑:智能机器人系统
更多精彩内容请关注公众号:BFT机器人
本文为原创文章,版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。