(报告出品方/作者:广发证券,旷实、叶敏婷、徐呈隽)
一、ChatGPT:AIGC 应用落地的奇点到来
(一)ChatGPT 面世的行业背景:AIGC 技术的厚积薄发,大厂布局相 互追赶
自2022年11月底发布以来,OpenAI推出的大型语言模型(LLM,Large Language Model)ChatGPT在全球迅速引发广泛关注,ChatGPT在智能问答领域实现了变革 性突破,能够回复多轮问题、承认错误、质疑、拒绝,智能程度更接近人类。ChatGPT 的出现对搜索领域产生直接冲击,相比传统推荐机制的搜索模式,ChatGPT的回答 更直接、能够极大减轻用户的信息检索和信息整理成本。根据Similarweb数据,上线 仅2个月,ChatGPT的月活用户数已达到1亿人,现象级产品TikTok达到这一用户量 级用了约9个月。作为AIGC在文本生成领域的应用,ChatGPT打开了AIGC在C端广 泛应用的大门,AIGC在文字场景的应用迎来奇点,也带动板块整体关注度的提升。
行业发展看,随着底层算法的持续迭代优化,大厂在技术侧的大力投入厚积薄发。 根据腾讯研究院发布的《AIGC发展趋势报告2023》,三大关键节点推动AIGC的发 展:(1)基础生成模型在底层逻辑上的突破创新。2015-2017年,扩散模型(Diffusion Model)、Transformer模型的提出,生成算法不断突破。(2)预训练模型的出现, 模型参数量级迅速扩大。2018年,谷歌基于Transformer模型推出NLP预训练模型 BERT,参数量级达到4810亿,基于大规模数据训练的模型在下游多模态的迁移学习 方面展现出了较强的适应能力。(3)多模态技术的应用,提升AIGC通用能力。CLIP 模型实现文字与图片的信息转换,是OpenAI旗下AI绘画产品DALL-E的关键技术。综 合来看,技术层面,生成模型的迭代创新、预训练模型的出现、参数量级的提升、多 模态技术的运用,逐步构建了ChatGPT出现的关键技术要素支撑。
底层技术的进步反映在更接近C端的应用层,关注度提升,推高行业热度。过去AI技 术的发展主要停留在技术、科研层面,由于在实际应用中的测试效果不佳,下游应 用范围受限,仅能支持基础的文本写作、代码生成等功能。随着CLIP、GPT-3等大 参数量级的大模型推出,模型的“智能”水平显著增强,AIGC在实际场景中的应用 效果得到优化,能够完成长文本、长代码生成,智能问答的准确度和语义表述精确 度大幅提升。同时多模态技术的发展也拓宽了下游应用场景,包括基于CLIP和 DALL·E的AI作画,基于Florence的图片、视频分类等。22年年底的AI作画、ChatGPT 为代表的AI问答等受到广泛关注,应用的不断落地标志着AIGC行业进入发展的新阶 段,商业化变现空间可期。
行业发展背景来看,ChatGPT的火爆是多年积累的底层算法能力、算力水平提升的 共同推动下,在技术发展到一定节点后,传导到C端,得到多元广泛应用的结果。但 AI技术的应用仍然存在包括伦理争议、暴力内容等问题需要解决,大范围应用落地 仍需时间。此前,搜索引擎巨头Google作为AI领域的重要厂商之一,先后提出了 ChatGPT中使用到的RLHF、Instruction Tuning等重要概念,并与2014年收购的公 司DeepMind一起推出了包括T5、Gopher、LaMDA、PaLM等在内的预训练模型, 2022年9月,DeepMind还推出了加入RLHF和Retrival的Sparrow模型,可用于与用 户闲聊并回答一些提问,但Google考虑到声誉风险等问题,在AI聊天机器人尚未完 全成熟、可能提供错误或不当回答的情况下,延缓了类ChatGPT AI问答产品的推出 时间。从ChatGPT表现看,目前AI聊天机器人在伦理、道德等方面仍旧存在诸多问 题,并可能受用户的诱导提供不当回答。例如在与新必应交流过程中,出现了劝说 用户与妻子分开、和它在一起等有悖伦理的回答;在医疗等较为严肃的场景中, ChatGPT可能会出现的不合理回答也同样难以接受。
(二)ChatGPT 成功的原因:OpenAI 不计成本的投入,打开 C 端应用 想象空间
公司能力看,OpenAI在技术上持续深耕,不计投入、勇于探索新的技术路线;管理 层的创投背景和团队对AGI理想愿景的坚持受资本青睐,打造出目前市场效果最优的 ChatGPT模型。
1、OpenAI:技术深耕,关键模型实现变革性突破
OpenAI专注于AI相关技术与应用的探索,由Elon Musk(特斯拉CEO)、Sam Altman (YC创业孵化器总裁)、Peter Thiel(PayPal联合创始人)等人在2015年共同创立, 并承诺共同投入10亿美元。OpenAI致力于打造“安全且有益的通用人工智能”,除 GPT系列外,OpenAI还发布了根据文字生成图像的DALL-E模型、AI音乐创作模型 MuseNet、Jukebox等,涉足AIGC的多个细分领域。
发展历程看,OpenAI发展经历了三个发展阶段:
(1)2015~2018年,公司坚持非盈利组织的定位,不考虑盈利,并开源所有技术。 比起一家创业公司,OpenAI更像一群追求通用人工智能(AGI)技术及其合理应用 的理想主义者团队。2016年,OpenAI发布了开源平台Universe,由微软、英伟达等 公司共同参与打造,能够在包括网站、游戏在内的几乎所有环境中衡量和训练AGI。
(2)2018~2021年:技术突破,推出GPT、DALL-E等重要模型,转型盈利导向。 2018年6月,OpenAI推出拥有1.17亿参数的GPT-1预训练模型,在NLP领域获得了 比谷歌2017年推出的Transformer更优的效果。2019年2月,OpenAI迭代出GPT-2, 参数量级达到15亿,验证了大训练集、大参数量训练出的模型的迁移学习能力。但 大模型带来的训练成本也迅速增加,非盈利性质无法长期维持项目运转,同时,马 斯克也退出OpenAI董事会。2019年3月,公司宣布重组,转为盈利性质(但限制回 报上限100倍),同时后续技术不再开源。同年7月,OpenAI获得了微软的10亿美元 投资,与龙头互联网平台自此实现了深度绑定,微软的Azure云服务平台也一定程度 缓解了OpenAI的训练成本压力。2020年、2021年,公司分别发布了1750亿个参数 的语言模型GPT-3、自然语言生成图片的DALL-E等关键模型,技术壁垒得到巩固。
(3)2021年至今:技术成熟,向下游应用渗透,商业化起步。2022年4月,OpenAI 发布DALL-E2,实现更高分辨率的AI图片生成;11月,发布ChatGPT,以对话形式 交互,可以连续回答问题、承认错误、质疑不正确的前提、拒绝不适当的要求,智能 程度进一步接近人类,在文本生成、搜索等领域获得了广泛应用。2023年2月,随着 ChatGPT在全球的火热,OpenAI宣布推出付费方案ChatGPT Plus,以每月20美元 的订阅制收费;同时,微软将ChatGPT能力进一步与自身业务结合,发布新版Bing 搜索引擎和Edge浏览器,预计将能够处理更复杂的搜索提问。
2、管理层&投融资:受资本青睐,管理层前瞻眼光、大胆投入,微软合作加速商业 化
OpenAI董事会及管理层成员大多拥有丰富的技术或投资背景。董事会主席兼总裁 Greg Brockman曾担任Stripe的创始工程师,并于2013年成为Stripe的首位CTO,首 席科学家Ilya Sutskever和2019年图灵奖得主Geoffrey Hinton共同发明了卷积神经 网络AlexNet;Sam Altman曾担任Y Combinator总裁,有丰富的投资经验,投资了 包括Airbnb、Stripe、Reddit等知名公司。OpenAI的非雇员董事背景也十分丰富,多 位董事是头部互联网公司的创始人或首席执行官,也有董事具备丰富的政府背景或 人工智能研究背景。
融资方面,OpenAI创始人中有多位硅谷知名投资人,创业基因和对AGI的美好愿景 吸引了资本关注。2019年微软10亿美元的投资成为公司发展的重要节点,微软成为 OpenAI独家云计算提供商;2023年1月,微软宣布向OpenAI进行一项为期多年、价 值达一百亿美元的投资,进入长期合作伙伴关系的第三阶段,OpenAI投后估值达到 290亿美元,成为美国最有价值的初创公司之一。 根据《Fortune》,若OpenAI在市场上盈利且大获成功,微软可从一系列投资中获得 最多920亿美元的收益,参与收购的其他VC则能够获得高达1500亿美元的收益。当 OpenAI开始盈利后,会优先偿还第一密切合作伙伴的本金;第二阶段,微软将有权 获得OpenAI 75%的利润,直至其收回130亿美元的投资;第三阶段,微软的利润分 配比例下降至49%,另有49%的利润分配给员工(41%)和第一密切合作伙伴(8%); 第四阶段,当投资者收益已达利润上限后,OpenAI重新变为非盈利组织,微软和其 他风险投资者的股份将无偿转让给OpenAI的非盈利基金。
3、ChatGPT:技术突破,商业化加速
从GPT-1到GPT-3:参数量、训练量指数级增加,大模型在多个领域实现较高的迁移 效果。算法本身的特性看,GPT系列从1到3都采用了Transformer架构,GPT-3的本 质仍然是通过大量参数、大量训练集数据的学习,依赖Transformer强大的拟合能力 使得模型能够收敛,因此GPT-3学到的模型分布很难摆脱数据集的分布情况,需要 持续更新训练集。算力方面,由于参数量和训练数据体量的急速扩展,对底层算力 的要求也持续增加,训练成本较高,根据Lambda Labs,GPT-3训练一次的成本或 可高达460万美元。
面向下游应用的商业化看,ChatGPT的应用场景丰富,To C端应用场景广阔。根据 公司官网,OpenAI罗列出48个使用场景,具体可分为回答、分类、代码、对话、总 结、翻译和转换七类,基本涵盖日常所需的大部分文字使用场景。ChatGPT可满足 使用者代码编写、语言翻译、回答问题、文本创作等办公场景需求;同时可以通过聊 天、生成菜谱、生成健身建议等满足生活场景需求,迁移学习能力极大拓展了使用 场景。
To B端应用商业化看,有望赋能新闻、金融等文字工作相关领域以及搜索、客服等 交互式对话工作领域。BuzzFeed计划使用OpenAI开放的API加强部分内容创作,并 为观众个性化一些内容,让人工智能在公司的编辑和业务运营中发挥更大的作用。 搜索引擎方面,微软于2月8日发布的新版Bing搜索引擎吸取并优化了ChatGPT与 GPT-3.5的精华,提供比ChatGPT更强大的运作,可以更容易理解使用者输入的字 词,进一步搜寻完整答案,产出更符合实际解答的内容以提供全新的搜索体验。 OpenAI所开放的API接口已经在上千个应用程序中被部署,涵盖从学习新语言到解 决复杂的分类问题等不同任务。
国内上市公司接入ChatGPT情况看,已接入的大部分公司使用GPT模型应用于虚拟 数字人场景,也有部分公司发力AI绘图、智能搜索引擎、文案及代码编写等场景。 天娱数科旗下数字人接入模型后在TikTok跨境电商直播、虚拟主播直播互动等场景 实现应用;蓝色光标旗下数字人苏小妹采用ChatGPT技术介入AI多轮对话,其AI作 诗能力已进入技术测试阶段;风语筑旗下数字人接入ChatGPT以强化场景识别能力 和更新能力;开普云旗下数字人与GPT-3-003接口对接后形成更可靠的数字人对话 服务;天地在线和捷成股份参股的虚拟技术提供商世优科技接入ChatGPT训练数字 人专有大脑形成个性化模型。招商银行、江苏银行等金融公司将ChatGPT融入文案 编写、代码编写等日常办公领域;吉宏股份在2023年1月即接入GPT API接口,通过 ChatGPT赋能跨境电商业务,累计帮助公司上新品1万余个,接手客户闲聊和安抚对 话10万余次,节省客服1000人次工时,生成新的广告文案7万余条,帮助公司处理图 像素材2万余个,公司团队还利用ChatGPT在千万级商品中新挖掘了150万种商品之 间的关系。
商业化手段看:订阅制面向有较大使用需求的消费者,API接口主要对接B端客户。 OpenAI在2月初推出ChatGPT Plus试验订阅计划,价格为20美元/月,目前仅对美国 用户开放。订阅者可以在流量高峰正常访问ChatGPT,享有更快的响应速度以及 ChatGPT新功能使用优先权,有高峰时段使用需求的消费者可以通过订阅满足日常 使用;OpenAI还提供基本模型、微调模型以及嵌入模型的API接口,针对不同的模 型型号根据Tokens数量收费,企业等专业开发者可通过API接口接入ChatGPT,对 模型进行调优,以更适应垂直领域的应用需求。
二、国内外产业链布局:大厂尝试大模型突围,应用层 多元场景接入打开商业化空间
(一)产业链:上游算力支持,互联网大厂相继布局,应用逐步多元化
ChatGPT是AIGC在NLP领域的产品化成果,从模型本质看,都属于内容生成式人工 智能。产业链看,ChatGPT作为对话机器人,是产业链下游的应用产品;所采用的 GPT模型是AIGC产业链中游的变革性突破,同样需要AIGC行业上游的AI芯片、深度 学习算法框架等提供算力、算法支持。ChatGPT的面世也拓宽了产业链下游应用场 景,加速了AIGC的商业化进程。AIGC行业可分为硬件层、模型层、应用层,其中: 硬件层,主要包含AI芯片,用于为模型训练及模型推理提供算力支持;AI芯片竞争格 局方面,英伟达占据主要地位,国产企业中百度、华为、阿里巴巴、寒武纪等头部科 技企业依托自身技术及业务优势重点进行了相关芯片布局,推出百度昆仑芯2、华为 昇腾910、平头哥含光800、寒武纪思元370等优质AI芯片,发展较为迅速,为预训练 大模型提供算力支撑。
模型层方面,近年来随着AI芯片的快速迭代以及AI框架算法的持续进步,预训练模 型参数量实现指数级增长,从千万量级快速增至千亿量级,而在庞大数据训练下,AI 预训练模型也得以快速发展,内容多样性、可控性等进阶需求得以满足。另外,多模 态预训练模型的出现使不同模态、不同来源数据和信息的融合处理得以实现,满足 了AIGC融合场景下的创作需求,使AIGC技术应用场景广度得到极大提升。在AIGC 模型研发阶段,开发人员通过对已有预训练模型进行剪裁等方式的微调,即可实现 用于特定场景、特定需求下的模型量产,与传统AI模型训练相比,能够极大程度上降 低训练时间与成本,因此预训练模型是AIGC产业实现商业化的重要环节。由于预训 练模型开发需要拥有超大规模算力以及海量数据支持,国际上预训练模型开发以资 金与数据较为充沛的头部互联网公司为主,如谷歌、微软、Meta等,国内具备预训 练模型研发能力的公司主要有百度、华为、阿里巴巴、腾讯、字节等。
应用层方面,AIGC凭借强大、高效的内容创造能力,在文本、代码、图像、视频、 3D、游戏等领域均有丰富应用场景。例如在文本领域,AIGC可用于营销文案生成与 小说创作,能在降本增效的同时获取丰富、高质量的文本内容;在图像领域,AIGC 可用于图像属性编辑以及图像端到端生成,同时在多模态模型下,用户还可通过文 本输入进行AI绘画,极大丰富艺术创造形式;在游戏领域,AIGC可用于游戏辅助制 作,用于生成游戏内随机地图、关卡等内容,通过NLP模型还可丰富玩家与游戏内 NPC交流内容,为游戏玩家带来更加生动、丰富的游戏体验。未来随着AI芯片算力 提升、预训练模型持续发展,AIGC覆盖板块将有望进一步扩展,AIGC应用市场具有 较大潜力。
(二)模型层:大模型卡位战激烈,技术路线、算法效果存在差距
模型层看,目前大模型是业内一致认知的技术路线,但需要庞大的训练集和较高的 训练成本,大厂天然具备优势。行业的主要参与者包括谷歌、OpenAI(与微软深度 绑定)、Stability AI(亚马逊合作)、百度等,国外厂商在技术上相对更为领先。 技术、应用、数据互通演进,大模型实现迭代闭环。大模型技术持续不断地发展, 已经从单模态技术发展到了多模态技术和跨模态技术,技术供给的持续丰富促进了 应用的繁荣,比如AIGC、数字人、生物计算等,同时大模型技术促进了端对端智能 系统的快速发展,进一步提升了应用的效果和效率,而这些应用在和用户与环境交 互的过程中产生了海量的新数据,数据又不断驱动大模型技术的升级,从而形成了 “技术-应用-数据”的正循环。
大模型技术发展趋势一:资深技术日趋成熟。大模型在发展的过程中越来越成熟, 基于思维链的Flan-PaLM模型已经具备基本的推理能力,基于层次化的ERNIE 3.0 Zeus可以更好地建模不同任务的共性与特性,再通过将不同的任务组织成统一的自 然语言形式,统一建模增强模型的泛化能力。相对其他模型,ERNIE 3.0 Zeus在各 类NLP任务上表现出了更强的零样本和小样本学习能力。为了进一步降低落地门槛, 也出现了效率高、泛化能力强的轻量级大模型ERNIE 3.0 Tiny等。计算机视觉 (Computer Vision,CV)大模型发展迅速,百度提出了VIMER-CAE模型,强化了 图像分割能力,具有较强的泛化能力;Google训练了一个规模达170亿的多任务视觉 学习模型PaLI,效果超过通用多模态基础模型BEiT-3。跨模态技术(Cross-Modal), 百度提出的文心ERNIE-ViLG 2.0可以生成语义更相关、质量更高的图片。
大模型技术发展趋势二:使用门槛持续降低。如何应对大模型学习的海量知识和技能,以及在对速度、时延和存储有严格要求的应用场景中使用更轻量化的模型,是 大模型降低使用门槛所面临的两个主要挑战。针对这些挑战,百度提出了两种解决 方案:首先,为了在应用中有效激发大模型的海量知识从而达到最好效果,公司提 出了Prompt技术,通过在输入数据中插入一些提示信息,来指导模型进行学习和推 理,设计好的Prompt能够帮助模型更好地理解数据,并且可以提高模型的准确性和 效率。目前,大模型已经能够自己编写Prompt,且超越了人类水平,大模型在下游 任务中的门槛进一步降低。其次,在一些应用场景中,速度、时延和存储的要求非常 高。因此,百度推演出大小模型协同促进的研发范式,大模型将效果推到极致,使小 模型能够向大模型学习;小模型则利用已有的知识来辅助大模型进行知识选择,提 高迭代效率,降低使用成本。大小模型的协同进化产生了飞轮效应,从而促进技术 的演进和应用的落地。
大模型技术发展趋势三:平台集约化发展,加速应用创新。以百度为例,公司以大 模型能力为核心,开发了文心大模型套件ERNIEKit。通过该套件,用户可以使用多 维度的能力,例如数据处理、模型预训练、模型微调和模型快速部署等,支持40+应 用场景,由此衍生出来的能力可以通过开发平台和服务平台,向开发者和生态系统 进一步赋能,从而实现整个平台在大模型应用落地全周期的覆盖,降低开发门槛。
细分赛道看,ChatGPT所在的NLP赛道,以2017年谷歌推出Transformer模型为节 点,海外迭代节奏更快,竞争更激烈,国内仅百度一家先发优势明显。海外模型的 迭代看,2018年OpenAI推出了GPT-1,只采用Transformer的Decoder结构,参数量 级达1.17亿,获得了更优的效果。同年,谷歌发布BERT模型,基于Transformer的 Encoder结构,参数达到3亿个,对自然语言的理解进一步加深,模型效果超越GPT1。2019年-2020年,OpenAI相继迭代了两版GPT模型,在算法上基本沿袭GPT-1的 框架,参数量级以10倍左右的速度提升,GPT-3达到1750亿个参数,是纯粹的无监 督训练模型。同一时期,谷歌则坚持采用Transformer结构+无监督学习+有监督学习 的技术路线,参数量级从T5的110亿提升至2021年Switch Transformer模型的1.6万 亿,在计算资源相同的情况下,Switch Transformer的训练速度可以达到T5的4-7倍。
2021年后,无论是OpenAI还是谷歌,都在模型上有所突破。OpenAI基于GPT系列, 引入基于人类反馈的强化学习,对模型效果产生了较强的增益,成功迭代出 InstructGPT、ChatGPT两个模型。谷歌2021年推出了技术路线与GPT系列类似的 LaMDA模型,参数量级1370亿,2023年为了应对ChatGPT的冲击,推出了基于 LaMDA的轻量级版本Bard,相对ChatGPT更具内容的时效性,但问答效果与 ChatGPT仍有一定差距。此外,谷歌还加大外延投资,投资Open AI前员工成立的竞 品初创公司Anthropic,其推出的Claude模型采用AI反馈强化学习进行训练,模型效 果仍需进一步验证。
国内看,发展滞后海外,但在NLP领域,不同语言体系的语法、语义结构差距较大, 国内厂商的模型在中文样本上更具优势。厂商竞争力看,百度具备一定先发优势。 百度2019年基于BERT模型的改进,推出了文心大模型1.0,此后又迭代了2.0和3.0 版本。在ChatGPT出圈后,百度基于文心大模型,迅速推出了类ChatGPT产品“文心一言”,并与众多下游应用厂商达成合作,拓展生态应用版图。在百度搜索引擎、 云计算等成熟业务的助力下,“文心一言”有望成为国内率先商业化落地的产品。
(三)应用层:多元应用打开商业化空间
AIGC在内容生产领域中具有革新性的意义,运用其搜集、整合和生成的能力,能够 大幅减少用户将创意概念向产品雏形、草稿转化的时间和成本。特别是在标准化要 求较低、较为重视感性与体验的场景中,AIGC帮助用户将创意与具体实现过程分离, AIGC取代了大量重复的具体实现过程所需的劳动力,并逐步压低边际成本。在影视、 娱乐等内容需求丰富的领域,AIGC已经具备大规模辅助生产的水平,能够率先实现 商业化落地;而在内容精度、数据准确性要求更严格的行业赛道上,如银行、金融、 教育、医疗等领域,AIGC的能力尚不能完全满足使用场景的要求,产品的生产和商 业化落地仍需相应人才的参与、配合、检验。长期来看,很多核心技术或创意与具体 实现过程可分离的赛道,未来都有可能成为AIGC的应用场景,并借助AIGC的能力实 现“工业化生产”。
目前,以ChatGPT为代表的AIGC产品商业化有望在以下途径较快落地: (1)内容生产的降本增效:在创意密集度高、交互需求较强的行业,AIGC工具能 够根据用户的指导,高效率地进行内容的生成、加工、批量编辑和风格转换等,在营 销、图片、音乐、视频、文本、游戏、虚拟人和元宇宙等各媒介中均有广阔的应用空 间,并已经涌现出AI绘画、写作助手等一批新应用。 (2)辅助办公和软件服务:将AI嵌入搜索引擎及办公软件中,通过自然语言处理实 现邮件自动生成、文献和会议翻译、代码生成和智能搜索等功能。微软已经在讨论 将OpenAI的模型整合到Word、PowerPoint、Outlook和其他应用程序中,以便用户 可以通过简单的提示自动生成文本;DeepL翻译器使用基于Transformer架构的人工 神经网络进行文本翻译,部分AIGC产品已经融入用户的日常办公场景中。
在AIGC技术的商业化节奏上,国内外厂商存在差异。现阶段,国外厂商在C端应用 的商业化上步伐更快,已经能够实现C端变现。代码网站GitHub基于自身公开存储库 的数十亿行代码训练了Copilot,该AI可以根据开发者的需求辅助生成和修改代码, 个人用户的订阅价格为10美元/月;会议软件Teams计划推出Teams Premium,订阅 用户可启用多种基于GPT的高级功能,包括AI会议总结、实时字幕翻译、搜索口述 文本等,预期价格为10美元/月。
除具备技术优势的头部企业外,国外还涌现一批各具特色的初创企业,多采用基于 大模型调优后,建立在垂直领域效果更优的小模型的方式。如Midjourney的图像生 成AI推出了三档收费计划,其中标准计划向用户开放每月15小时的高速GPU运算使 用时间和商用许可,每月收费24美元;能够使用26种语言编写商品说明、视频脚本 和在线等内容的写作辅助AI工具Jasper也采取多档收费的订阅模式,个人用户可以 根据每月生成的字数选择49美元/月到500美元/月不等的套餐。 由于模型效果与ChatGPT等海外前沿模型仍存在差距,国内C端应用用户认知仍在 逐步建立,国内B端应用生态有望先行。百度以文心ERNIE模型系统为底层模型的类 ChatGPT产品文心一言宣布推出后,吸引了大量B端厂商积极合作。近期官宣的首批 生态合作伙伴中,主要以新闻媒体、垂直内容平台、广告营销企业和软件开发公司 为主,主要合作方向涵盖软件服务、营销、搜索、文字、视频、虚拟人和元宇宙、语 音等方向,以提供相关应用API的方式向企业端客户提供服务。
三、AIGC 应用场景:内容生成降本增效,商业化空间 可期
AIGC应用于传媒互联网领域, ChatGPT有望对搜索领域带来变革,同时,通过AI 实现内容生产、创意实现,与游戏、音乐、图片、营销等领域结合,都有可观的潜在 商业化空间。
(一)微软将 ChatGPT 和全线业务进行融合
微软作为OpenAI最大投资方,将ChatGPT与自身全线业务融合,在办公、搜索等领 域尝试探索新的模式。我们整理了微软的主要业务模块,微软的产品兼顾向企业端 的服务,以及个人用户服务。
1、生产力和业务流程相关业务。该业务模块包含(1)Office commercial, 产品包括 Office, Exchange, SharePoint, Microsoft Teams, Office 365 Security and Compliance, 以及Skype for Business等应用。其收入主要来自于企业支付的基于云 服务的软件接入订阅费或本地安装软件的许可费。微软Office 365是基于云的订阅服 务,企业可以通过付费订阅在线使用Word、 Excel、PowerPoint、Outlook等产品。 企业用户也可以在本地安装Office软件,即Office on-premises,购买许可证使用。 (2)Office Consumer,即面向个人和家庭用户提供的订阅服务,产品包含Word、 Excel、PowerPoint、Outlook。Microsoft 365 Consumer还包括Skype、OneDrive、 Teams等产品的接入服务。(3)Linkedin,是微软于2016年收购的社交网络,除了 拥有专注于建立人脉关系的社交平台,Linkedin还垂直于向企业客户提供招聘解决方 案、营销等解决方案的落地。Linkedin的收入来源包括广告变现、付费会员服务、人 才招聘服务和销售解决方案服务。(4)Dynamic business solutions是微软开发的基 于云计算的商业软件解决方案,包括ERP(企业资源计划)、CRM(客户关系管理)、 Customer Insights(客户洞察)等系列智能应用程序。
2、智能云。该业务模块包括两大块,(1)服务器和云业务,旗下包括Azure云计算 平台,提供包括虚拟机、存储、数据分析、人工智能等模块的服务能力。企业可以通 过Azure构建、部署和管理应用和解决方案。SQL Server是微软开发的关系型数据库 管理系统,可以在本地或云上部署,适配多类型操作系统和编程语言。还包括 Windows Serer和System Centor等服务器操作系统、系统管理套件。以及为开发人 员提供服务的GitHub,开发团队利用GitHub可以高效的协作和开发软件产品。(2) 企业咨询等服务。微软的咨询服务团队,可以为企业客户提供战略制定、业务梳理、 培训及软件/硬件部署的配套服务,皆在帮助企业实现数字化转型和业务创新。
3、更多个人计算业务。该模块包括(1)Windows,包括向OEM在生产时预装在计 算机上的Windows操作系统向微软支付的许可费,以及Windows商业产品的批量授 权,通常来自于企业批量采购设备时支付的许可费。(2)设备,包括Surface和电脑 配件等硬件设备的销售。(3)游戏业务,Xbox硬件和内容服务。(4)搜索广告, 来足浴Bing和微软平台的广告收入。 从收入结构来看,微软三块业务的占比较为均衡,近期智能云业务的收入占比和增 速相较于其他两块略显优势。整体来看,2021年全年微软收入达到1681亿美元,同 比增长18%。生产力和业务流程相关业务2021年收入达到539亿美元,同比增长16%, 占总收入的比例达到32%。2021年智能云业务收入达601亿美元,同比增长24%,占 比达到36%。更多个人计算业务在2021年的总收入为541亿美元,同比增长12%,占 收入比为32%。整体来看三大块各占近1/3的收入贡献,而增速均较为稳健,智能云 业务增长更快。
按细分业务来看,服务器和云业务、办公软件产品和云业务的收入贡献度最高,从 业务增速来看,游戏业务和Linkedin以及服务器和云业务的增速快于其他业务线。服 务器和云业务、办公软件产品和云业务2021年收入贡献分别为31%和24%,是前两 大收入贡献的细分业务。从增速来看,收入贡献为9%的游戏业务增长最快,21年同 比增速达到33%,其次服务器和云业务以及收入贡献占比为6%的Linkedin业务收入 增速都在27%,仅次于游戏业务。而相对更传统的Windows、Devices、企业服务业 务增速都较为缓慢,同比增速在4%。
搜索+聊天机器人是对C端用户感知最明显的使用场景。ChatGPT的语言模型可以优 化Bing对用户检索信息的理解能力,Bing的用户搜索需求和搜索行为也可以强化 ChatGPT的语言理解模型。
从目前的全球各搜索引擎访问量来看,Google占据绝对优势。根据Similarweb的访 问量统计,2022年11月-23年1月期间,谷歌网站的总访问量达到2598亿,以绝对优 势领先于其他搜索引擎;同一期间Bing的访问量为35亿,duckduckgo为26亿。而从 设备分布来看,Google的流量移动端占比最高,达到59%;其他引擎的PC流量占比 高于移动端。
根据2023年1月每天的搜索查询数量来看,美国地区微软系站点的搜索量有明显提 升。根据statista数据显示,23年1月每天的搜索引擎搜索量来看,微软站点有明显的 提升趋势,较月初每天100万次,提升至月末的每天500多万次。
因新的功能,Bing在移动端的下载排名攀升。从美国ios应用市场的免费榜单来看, Bing因加入了ChatGPT的对话功能测试,引发了用户下载使用,Bing在应用商店的 排名从过去的工具榜排名150+,到总榜的前100,持续占领效率类应用的榜首。虽然绝对下载量未超越Google,但也吸引了大量的新增用户。
(二)百度基于文心大模型推出产业级搜索系统“文心百中”
国内厂商看,百度深度布局从大模型到应用产品的产业链全景,布局搜索、图片生 成等重要应用场景。“产业级”和“知识增强”构筑文心大模型两大特性,坚定“降 低应用门槛”的发展路线。文心大模型全景图涵盖文心大模型、工具与平台、产品 与社区三个部分。文心大模型层由基础大模型、任务大模型、行业大模型的三级体 系构成,能够广泛应用于各行各业,满足不同应用场景的需求。工具与平台层包括 大模型开发套件、文心API和内置文心大模型能力的EasyDL和BML开发平台,有效 降低应用门槛。产品与社区层包括AI艺术与辅助创作平台“文心一格”、产业级搜索 系统“文心百中”和创意探索社区旸谷,增加用户对AI大模型技术的体验空间。
行业大模型推进文心大模型在产业应用中更深入的落地。文心·行业大模型是在通 用数据训练的文心大模型基础上,结合行业特有的大数据和知识,采用行业相关的 创新算法设计而成的。行业大模型的设计进一步提升文心大模型在行业应用中的适 配性,可以更好地应对行业领域的需求。目前百度与国网、浦发、航天、人民网、哈 尔滨、电影频道、深燃、吉利、泰康、上海辞书出版社等均有行业大模型落地,助力 行业的智能化转型升级。以电影领域为例,文心和电影频道联合发布的智感超清大 模型,深度结合百度的AI技术能力和电影频道长期积累的视频修复数据,通过对超 分辨率、去噪、去模糊、去压缩等多任务的联合预训练、亿级参数量的学习,同时实 现对多种损坏情况的修复,并通过画质提升、边缘锐化等方式增强视频的清晰度, 全方位提升视频修复效率和观感体验的效果。
搜索场景上,百度文心推出大模型驱动的产业级搜索系统“文心百中”。文心百中 由百度搜索与文心大模型联合研制,可以对文本信息、富文本信息、结构化信息、视 频信息进行精准语义搜索,覆盖知识搜索、合同搜索、人才库搜索、电商搜索、音乐 搜索、长视频搜索等多个搜索场景。极简、强大、高效是文心百中的三个主要特点, 文心大模型目前可以替代过去大量的传统搜索策略,策略极简驱动架构极简,从而 架构的研发和运营维护成本可以降低到一个新的量级,同时产品设计也做到了极简 化,仅需三步即可在线完成搜索引擎的构建;文心百中的语义理解能力非常强大, 几乎可以做到在搜索时不再需要担心语义问题;强大的模型能力和极简的产品设计 促使百中拥有从零开始建设搜索系统的能力,使得搜索系统的定制开发和实现上线 的周期或者人力成本能够压缩90%以上。 “文心百中”即将上线“知识对话”功能。通过搜索找到问题知识点的答案,需针 对有关知识内容进行统一建模。文心百中可以直接对多源异构数据进行建模,实现 针对各种知识内容的精准语义搜索。这个功能还可以应用于智能问答、问答辅助等 场景。
百度类ChatGPT应用“文心一言”将于3月正式推出。2月13日,百度宣布将于3月 正式推出基于文心大模型技术的生成式对话产品文心一言(ERNIE Bot)。据电商报 介绍,“文心一言”一些相关功能目前已陆续在百度搜索内上线或内测,包括多答案 回复、智能生成等。2月17日,百度智能云在2023 AI+工业互联网高峰论坛上宣布“文 心一言”将通过百度智能云对外提供服务,为产业带来AI普惠。论坛上,百度集团执 行副总裁、百度智能云事业群总裁沈抖表示,文心一言的能力将通过百度智能云率 先在内容和信息相关的行业和场景落地。相关行业如媒体、文娱、企业软件等,相关 场景如智能客服、员工培训、巡检日报、知识萃取等,都将率先使用文心一言的服 务。信息的高效流转和交互,也会进一步带来行业生产、经营效率的提升。据百度公 众号,目前已经有包括互联网、媒体、金融、保险、汽车、企业软件等行业的近300 家头部企业宣布加入百度“文心一言”生态。
Baidu坚守国内搜索市场行业龙头。2021年1月国内在线搜索月活跃用户已经达到 5.41亿,相较2018年1月提升1.12亿。从中国主要搜索引擎的市场份额看,Baidu位 居前列,截至2023年1月市占率65.2%,Sogou和Bing次之,市占率分别为12.7%、 11.5%。
(三)内容社区/在线阅读:变革内容创作生态&增厚数据价值
ChatGPT生成的文本内容已经呈现出可以媲美人类的优异表现,在内容社区、在线 阅读等领域有望产生直接助力。具体来说,ChatGPT可以根据用户的个性化要求生 成文本(包括但不限于小说/作文/论文/诗歌/新闻/营销文案/教材/演讲稿)、对文本进 行修改润色、续写内容等。根据《纽约时报》的报道,在北密歇根大学哲学教授Antony Aumann的世界宗教课堂上,由ChatGPT撰写的课程论文获得了全班最高评价。网上 也有多位职业教育老师测评了由ChatGPT生成的雅思作文,评分普遍在6分到7.5分 (满分9分)。
大厂在文本生成领域的主要产品除了ChatGPT(OpenAI)、Bard(谷歌)、文心一 言(百度)外,22年4月腾讯AI Lab推出智能写作助手“文涌Effidit”,定位在辅助写 作者提升效率,提供智能纠错、文本补全、文本润色、文本扩写、词语/句子推荐与 生成等功能,目前尚未提供长文本的创作生成。阿里达摩院先后于21年4月发布270 亿参数的大语言模型PLUG、于22年9月发布通义大模型M6-OFA,目前正在研发基 于通义大模型的类ChatGPT产品,兼具文本生成和图片生成能力。字节跳动在2016 年6月上线了新闻写作机器人Xiaomingbot。国内市场还涌现了彩云小梦、澜舟科技 等AI生成文本类应用。但是由于这些语言模型的参数量及训练量偏小,一般只提供 内容续写、文本润色等辅助性写作功能,且其生成文本经常出现上下文不连贯、逻 辑前后矛盾等情况,与ChatGPT的性能存在较大差距。
现阶段ChatGPT生成的文本依然存在明显缺点,例如我们向ChatGPT提问2022年全 国新高考I卷的作文题目,ChatGPT撰写的作文大篇幅引用题干、表述多次重复。一 方面AIGC技术已然掀起全球内容创作生态的革命,预期将在不远的未来显著提升内 容生产效率;但另一方面我们判断,基于机器学习底层技术的局限性,AI最终难以替 代创新性、感性、思辨性的优质内容创作。 (1)大语言模型(LLM)根据训练数据生成文本。由于数据集的局限性,对应生成 的文本可能缺乏特定领域常识、存在偏见、没有实时信息等。例如ChatGPT训练所 用的中文数据集较少,因此ChatGPT对中文的理解相对不足、响应能力较弱;同时 ChatGPT训练所用的数据更新至2021年9月,因此ChatGPT并不知道“Bard”等新 知识,对于医学、法律等领域的专业术语可能无法做出准确描述。 (2)AI可以生成有情感色彩的文本,但并不能理解情感,这导致AI生成文本的情绪 表达可能是不准确的、或是浅层次的。 (3)现阶段大语言模型可以理解上下文的部分信息,但是涉及文化常识、语言歧义、复杂结构文本时,大语言模型往往无法进行推理和逻辑推断,可能会因此生成逻辑 不合理或不连贯的文本。 (4)大语言模型只是根据已有数据进行预测和生成,不具备想象力或创造性,无法 生成创新性内容或创新性风格的文本。
(1)AI生成内容&辅助生成内容
如前所述,ChatGPT可以根据要求直接生成小说、回答、专栏文章、博文等内容; 同时也可以作为辅助工具,帮助创作者搜集资料、续写情节、润色词句、撰写草稿 等,有效缩短创作周期中前期筹备、中期瓶颈、以及后期修改的时间。在线阅读龙头 中文在线已与澜舟科技达成战略合作,澜舟科技向中文在线旗下17K小说网的作者提供文学辅助写作功能,可针对不同读者群体(男频/女频)、文体风格(都市/玄幻 /仙侠/古风),根据要求扩写、润色、续写小说内容。而知乎则在创作声明中增添了 “包含AI辅助创作”选项。
(2)AI开发多模态衍生品
AIGC领域的跨模态生成技术可通过原创IP开发多模态的衍生品。在技术维度,TTS (Text-to-speech)技术已相当成熟,被广泛应用于有声读物生成、自动配音等方面, 可生成不同方言和音色、乃至特定对象音色的音频内容。23年1月谷歌发布AI模型 MusicLM(暂未上线),可根据文本描述生成任意类型的高保真音乐。T2I(Text to image)在2022年迅猛发展,基于Diffusion模型,4月OpenAI推出了DALL-E2、7月 Stability AI推出Stable Diffusion(免费开源),相比前一代T2I产品显著提高了分辨 率、真实性和准确性。2022年8月在美国科罗拉多州举办的艺术博览会中,AI绘画作 品《太空歌剧院》获得了数字艺术类别冠军。文字生成视频技术尚在尝试阶段,2022 年10月谷歌发布了两款文本转视频产品“Imagen Video”和“Phenaki”。Imagen Video能够根据关键词生成1280*768分辨率、24帧/秒的高清视频片段,Phenaki能够 根据约200个词的提示语生成2分钟以上的长视频内容。不过到目前为止,Imagen Video和Phenaki都未向C端用户开放使用。
(3)赋能平台数据开发价值
从大语言模型的训练数据集来看,文心ERNIE(百度)、M6(阿里巴巴)的训练数 据量明显不及GPT-3(OpenAI)和Gopher(谷歌),并且数据集中包含Wikipedia、 BookCorpus、Common Crawl等大量英文数据,这说明优质的中文数据集非常稀缺。 而我国的在线阅读平台和内容社区拥有海量数据,以阅文集团为例,截至2021年底 平台累积作品总数约1510万部,当年新增字数超过360亿个。如果在线阅读平台和内 容社区能够将平台上的数据筛选处理为优质数据集,一方面能够增厚公司的数据价 值,另一方面也将加速中文大语言模型的训练优化。
(四)游戏:AIGC 可应用于游戏产品全生命周期,全面提升产业效率
以ChatGPT为代表的AIGC技术发展正在深刻影响着游戏行业,其应用主要可分为两 个阶段:一是作为辅助工具,替代信息挖掘、素材调用等方面的生产力;二则是直接 生成内容。目前生成式AI的应用还处于第一阶段。 在游戏领域,AIGC可以应用于游戏研发、游戏发行、游戏体验等环节,提高游戏内 容生产力。在游戏研发方面,应用AIGC技术生成游戏文案、道具、角色、音乐及场 景等可节省整个研发团队包括策划、美术、音乐及程序等各方面人力,极大程度提 升游戏开发效率,降低制作门槛,催生更多创意;在游戏发行方面,AIGC可助力创 建游戏推广计划,实现有针对性的精细化运营,提升游戏营销效果;在游戏体验方 面,AIGC可应用于玩家实时互动,主要体现在优化NPC对话、创建个性化角色以及 生成千人千面剧情等,使游戏更具交互性、可玩性与真实感,用户体验全方位提升。
1、AIGC可应用于游戏产品全生命周期,全面提升产业效率
(1)AIGC+游戏开发:全面提升研发效率,降低创作门槛
AIGC有望在文案、道具、角色、场景生成及玩法设计方面提升游戏研发效率,降低 创作门槛。随着游戏行业市场竞争加剧,产品研发成本持续高涨,尤其对于高品质、 内容宏大的游戏来说,制作难度更高、周期更长。以ChatGPT为代表的AIGC工具能够深度参与制作流程,广泛应用于游戏开发各个环节,主要体现在文本、图像、音 频、视频的AI生成,帮助制作游戏文案、道具、角色及场景,以及设计游戏关卡与整 体世界观。如果AIGC全面落地游戏研发,将全方位节省制作团队人力成本,包括策 划、美术、音乐、程序等环节,有效提升游戏研发效率,降低制作门槛,增强行业创 造力。
AIGC生成文本可制作游戏NPC对话、剧情及世界观。根据游戏的复杂程度,游戏中 可能存在大量NPC,需要创作者为其策划人物形象及对话文案,工程量巨大。AIGC 能够根据前期大量的模型学习与训练,为每个NPC自动生成具有独特设定、符合游 戏剧情的对话,增强互动性,打造更为沉浸的游戏体验。同样在游戏剧情及整体世 界观方面,AIGC可对海量剧本数据进行分析归纳,学习已有的人物关系与剧情逻辑, 通过算法构建完整的游戏叙事。除此之外,AIGC还可以与玩家互动,使其参与到剧 情制作当中,生成个性化的游戏体验。例如,网易旗下开放世界手游《逆水寒》上线 智能NPC系统,实现游戏NPC与玩家自由对话,并根据对话内容自主给出有逻辑的 行为反馈,极大程度上增强游戏交互性,提升玩家游戏体验。
AIGC生成视频可制作游戏动画。动画是游戏制作中最核心的环节之一,需要耗费大 量人力、物力与时间。如果能够应用AIGC自动生成游戏动画,游戏研发效率将显著 提升。目前依据文本生成视频的AI工具越来越多,例如,谷歌推出的Imagen Video 能够根据简短文本生成高保真视频,具有高度的可控性和理解力;Phenaki能够将详 细的文本提示转换为两分钟以上的长视频,还能产生有连贯性的多个视频,但质量 较低。Meta的Make-A-Video可以利用给定的文字、图像或视频生成一个几秒钟的短 视频。但目前生成视频技术还不足以应用于游戏动画实际制作当中,未来随着AIGC 技术的高速发展,有望实现文字、图像与视频的高效转换,极大程度提升游戏动画 的制作效率。
AIGC辅助玩法设计。在卡牌类或SLG类游戏中,每推出新怪兽、新副本或新卡牌组 合,均需要策划人员穷举所有可能,模拟所有游戏情况,这时人工验算不仅耗时耗 力,出错率也很高。若采用AIGC生成所有可能,就能够快速完成游戏策划,并保证 设计质量。例如,目前绝大部分游戏采用决策树方法来设计怪兽攻击方式,而AIGC 技术可以自动形成怪兽反馈机制,使怪兽反馈更加拟人化,更具真实性。 ChatGPT结合其他AI绘画、AI生成3D等AIGC工具协同使用能够进一步提升生产力。 ChatGPT的应用场景可归类为“文-文”和“文-代码”形式,若结合其他AIGC工具, 可以实现“文-文-图”、“文-文-音”、“文-文-视频”等一系列应用。由于ChatGPT等 对话式AI回答的准确性、时效性尚待提高,因此短期内适用于对准确性要求不高的 创意类场景。
(2)AIGC+游戏推广:AIGC应用营销全过程,提升游戏推广效率
游戏推广准备期,AIGC寻找宣传点并创建推广计划。AIGC所运用自然语言处理技 术能分析行业趋势、提供情感分析、总结用户画像、制作计划文书等。游戏推广初 期,AIGC自动快速生成高品质素材,降低营销成本。AIGC为素材制作者提供创意 并辅助其快速生成脚本、画面、视频等。超休闲游戏发行商Supersonic已使用AI工具 为游戏《圈鱼大亨》自动生成符合游戏风格的优质素材;腾讯混元AI大模型具有“图 生视频”“文案助手”“文生视频”等功能,自动生成推广素材,帮助游戏推广内容在 多渠道快速铺开。游戏推广后期,AIGC协助精细化运营,实现个性化营销。随着游 戏推广持续开展,广告投放效果下降,AIGC模型可根据用户特征以及前期投放活动 数据进行微调,针对目标受众量身定做推广活动,精准投放广告。自动化文案撰写 公司Persado结合营销心理学,利用NLP和机器学习自动生成基于用户特征和态度的推广素材,提高广告和目标受众的匹配准确度,有效提高转化率。
(3)AIGC+游戏体验:AIGC升级交互元素,提供个性化体验
AIGC让游戏中交互元素更智能,实现“千人千面”的个性化剧情,增强人机交互性与 游戏真实感。NPC是游戏中重要交互元素,AIGC实现NPC拟人化和差异化。完美世 界手游《梦幻新诛仙》智能NPC拥有独特性格爱好及处事方式,并对玩家行为和游 戏场景变化进行反馈,例如面对玩家求助时NPC会有逃跑、犹豫等不同表现,更接 近真人反应。除NPC外,AIGC可用于创建角色、道具、剧情、场景等其他交互元素, 打造“千人千面”游戏体验。基于AIGC技术开发的叙事游戏《Hidden Door》通过自 然语言生成(NLG)等技术构建游戏剧情,根据玩家想法即兴创作剧情和完善故事 细节,降低创作门槛,以交互方式创造个性化、高自由度游戏体验。
2、网易《逆水寒》实装国内首个游戏GPT,多家公司积极布局AIGC
目前多家公司已布局游戏领域的AIGC。网易手游《逆水寒》实装国内首个“游戏GPT”, 智能NPC系统帮助打造更具沉浸感的游戏世界,提升玩家参与度与交互性。此外, 腾讯、米哈游、恺英网络、巨人网络、三七互娱、完美世界、吉比特、昆仑万维及中 文在线等公司均积极布局AIGC赛道,主要可分为AIGC产品研发、虚拟数字人AI交互、 游戏产品开发应用等方向。
(1)网易《逆水寒》应用AIGC技术打造智能NPC系统
《逆水寒》智能NPC系统可在具体情境中应用,与游戏机制深度结合。2月15日,网 易旗下已获得版号的武侠题材开放世界MMO游戏《逆水寒》手游宣布,首次实装“完 全由AI驱动的高智能NPC”,应用与ChatGPT同源的底层AI技术打造而成。游戏中的 NPC能够和玩家自由对话,并给予对话内容自主给出有逻辑的行为反馈,且NPC之间也会互相交流影响形成巨大社会关系网。玩家和NPC的交流交互不再是设定好的、 流程式的,而是做到无设定自由交互,更加贴近真实的开放世界。 基于AI,有望实现游戏内容无限生成、玩家零门槛创作。与ChatGPT不同,“逆水寒 GPT”的学习范围更专注于游戏世界,其重点在于理解语义进而指导NPC下一步行 动。游戏官方公众号指出,未来智能NPC有可能实现根据玩家对话含义进行无限延 展,进而无限生成个性化的游戏内容。除此之外,“逆水寒GPT”还有望实现根据玩 家文字命令生成脸部模型、编辑视频等。
(2)游戏公司广泛应用AI,逐步扩展AIGC
广泛应用传统AI技术,获取技术方式多样。网易、腾讯、吉比特、等多家游戏公司均 已布局传统AI多年,涉及领域包括智能NPC、AI挂机、数字人等。吉比特《一念逍 遥》采用AI挂机玩法,玩家下线后AI将继续打怪升级;网易《倩女幽魂》使用了开放 式智能对话AI,玩家与“宝宝”的对话将随着等级提升而改变。腾讯、网易、米哈游、 字节跳动、三七互娱等成立研究团队,直接从事AI研究和应用;莉莉丝、风语筑、巨 人网络等与启元世界、百度、商汤科技等科技公司达成合作,将模型应用于游戏产 品中。 逐步扩展AIGC,自动生成游戏要素。随着UGC向AIGC发展,游戏公司将AIGC技术 融入游戏研发、发行环节,自动生成语音、图像、代码等游戏要素,实现降本增效。 腾讯打造虚拟偶像AI艾灵,利用AIGC技术实现作词和演唱歌曲;凯撒文化公司通过 深度学习技术快速制作游戏剧情动画,已取得一定进展;昆仑万维AI绘画模型“天工 巧绘”允许输入中英双语的提示词,通过文字描述自动生成图像,实验室MusicX Lab 基于AIGC技术快速生成歌曲伴奏。
AIGC游戏商业化前景广阔,但目前应用程度有限。游戏产业内容形式复杂、艺术发 挥空间广阔、吸金能力强大,对于AIGC技术存在明显需求。但目前AIGC在实际制作 中的应用程度有限,在文本、道具和角色生成上的使用率仍处于较低水平,场景生 成则几乎不可能完成。就发展相对成熟的自动生成文本来说,目前AIGC无法直接输 出游戏脚本,但可以完成基础或部分边缘剧情,核心人物的语言仍需要人工完成, 且最终内容的呈现还需人工在AIGC的基础上进行优化与审核。因此,AIGC技术目前 主要是作为辅助工具应用,并不能直接生成具有差异化、竞争力的内容。此外,AIGC 技术应用还受到高昂成本制约,AIGC自动生成内容可以降低游戏制作门槛,但使用 模型以及配备相关人力需要付出的高昂成本可能使得大部分游戏公司望而却步,难 以实现AIGC在游戏行业的广泛应用。
(五)营销:AIGC 赋能营销全流程,降本增效,提升交互体验
营销领域应用看,AIGC高效的内容生产能力搭配AGI广泛的通用能力有望赋能“广 告创意——营销内容输出——触达消费者——完成消费转化”的营销全流程,提高营销内容创新性和丰富度的同时,降本增效,带来更好的营销效果。广告创意阶段, AIGC能够自创作,具有一定的创造力,减轻营销公司在内容创意方面的压力。营销 内容生成阶段,AIGC能够大量、高效产出营销内容,包括文字、图片、语音、视频 等各种形式,帮助营销公司在内容生产环节降本增效。广告投放、触达消费者环节, “品效合一”大趋势下,AIGC能够更好推进“千人千面”,有效提升ROI。AIGC通 过对大量用户数据的学习,能够更精准地匹配消费者偏好,真正实现千人千面,提 升触达消费者的广度和精确度。在最后的消费转化环节,AIGC赋能虚拟人等新营销 形式的表达,提升消费者交互体验,给消费者留下更深刻的品牌印象,进而提升消 费转化效果。
实际应用的落地看,国内外均已推出相关产品。AI写作工具Jasper AI在生成营销内 容时,会考虑广告的目标受众、关键词分析、市场格局等因素,确保生成的内容对潜 在客户具有吸引力,提升转化销售的概率;此外,Jasper AI还可以用于撰写社交媒 体的营销文案,提升社交媒体营销软文内容的丰富度。 国内方面,2022年12月,蓝色光标旗下智能营销助手销博特发布AIGC“创策图文” 营销套件,包括策划生成、创意生成、图片生成、文本生成,提供根据品牌名、关键 词等品牌特性一键生成企业Slogan等服务。此外,AI智能客服除了可以取代原先的 人工客服和不智能的数字客服以外,还可以通过聊天的形式向消费者介绍需推广的 产品和服务,开辟广告以外的销售增长点。2月21日,蓝色光标销博特公测“萧助理” Beta版,将聊天机器人程序与销博特AIGC输出能力相结合,通过文本对话模式,“萧 助理”能够帮助用户完成策划案撰写、品牌slogan批量输出、模板海报生成等工作, 极大解放营销团队的内容生产力,实现降本增效。
梳理国内营销公司在AIGC的相关布局,主要聚焦虚拟人业务的降本增效。蓝色光标 利用AIGC技术,将虚拟人建模生产时间从2周缩短至3分钟,极大提升生产效率。此 外,根据蓝色光标,在与百度“文心一言”达成合作后,将把百度的智能对话技术应 用在AIGC营销场景,包括提升“苏小妹”等虚拟人的实时对话能力、蓝标智播和分 身有术等蓝色光标旗下虚拟人制作工具的生产能力等。此外,捷成股份参股子公司 世优科技、天娱数科等也已将ChatGPT为代表的智能对话产品接入自身虚拟人业务, 有望大幅提升虚拟人的可交互性、沉浸感。三人行、风语筑等公司也已运用AIGC技 术,赋能公司营销创意、营销内容生产、虚拟空间生成等核心业务。
(六)流媒体领域的应用
我们认为类ChatGPT技术对于视频平台,不论是短视频、长视频都有较多的应用场 景,总结归纳如下:
(1)辅助内容创作,提高创作效率。这包括辅助创作者提供剧本创意,例如编剧在 构思剧本的时候,可以借助对话机器人生成创意,加速创作效率。对于短视频的内 容创作者,类ChatGPT工具可以提供AI特效,根据语音转换成字幕,根据语音转化 成视频,也可以将文本转化成音频,形成个性化的语音播报效果,类似这些AI辅助都 可以加速内容创作和迭代创意,丰富内容供给。
(2)辅助内容推荐,提升精准度。类ChatGPT工具可以协助视频打标签,提高平台 对视频内容的理解,进而进行更加精准的内容推荐。同时结合用户行为数据和视频 内容,推荐和用户需求更契合的内容。
(3)提升用户体验。在用户体验方面,类ChatGPT工具可以自动撒选评论中的负面 内容,提升平台治理水平,也降低人工管理的成本。而聊天机器人技术植入用户交 互界面,可以提升服务效率和精准度。用户也可以通过与聊天机器人的互动,获取 更多内容推荐。
从音乐流媒体来看,类ChatGPT或提升创作者写词效率。除了在歌词理解、内容推 荐等领域的应用,音乐人本身会涉及到歌曲创作的需求,类ChatGPT目前最直接的 辅助案例在歌词创作方面,对话机器人可以根据用户的内容需求进行歌词创作,快 速提升音乐人的写词效率,激发音乐创作灵感。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
精选报告来源:【未来智库】。