Chat-GPT的出现以及中短期内的产业化落地将会为从用户创作(UGC)到AI创作(AIGC)的转型提供关键的辅助支持。结合Chat-GPT的底层技术逻辑,我们认为Chat-GPT中短期内产业化的方向可能包括:1)Chat-GPT对于文字模态的AIGC应用具有重要意义,在归纳性的文字类工作中展现出了极其优异的表现。2)代码开发相关的工作更加规整非常适合AI辅助生成。3)图像生成领域:GPT模型在图像生成领域目前效果略逊于扩散模型,但扩散模型可以利用Chat-GPT生成较佳的Prompt,提供强大的文字形态的动力。4)智能客服类的工作。Chat-GPT的成功证明了Transformer模型并非陷入困境,不断的AI技术方法上的新突破正驱动全球AI产业进入加速发展阶段,叠加AI产业集群效应的不断凸显,AI产业有望成为全球科技领域中期最具投资价值的产业赛道之一。AI产业有望继续保持“芯片+算力基础设施+AI框架&算法库+应用场景”的稳定产业价值链结构,拥有完整数据闭环结构、良好数据自处理能力的企业有望持续成为受益者。
▍报告缘起:Chat-GPT引来新一轮AI大热,探索产业化可能性。
OpenAI团队最新公布的语言模型Chat-GPT于2022年11月30日向社区发布测试,并立即收到了良好的反馈。从测试反馈的结果看,相比于前一代的GPT-3,Chat-GPT以对话为载体,可以回答多种多样的日常问题,对于多轮对话历史的记忆能力和篇幅增强。与GPT-3等大模型相比,Chat-GPT回答更全面,可以多角度全方位进行回答和阐述,相较以往的大模型,知识被挖掘得更充分。Chat-GPT的强势“出圈”引来了对其未来可能的产业化方向的一系列测试,从测试结果来看,在归纳性文字、创作性文字、代码修改、科研辅助以及其它领域Chat-GPT均表现出了前代所没有的优点。对话式AI开始能在大范围、细粒度问题上给出普遍稳妥的答案,并根据上下文形成有一定的逻辑性的创造性回答。本篇报告将关注Chat-GPT背后的技术逻辑以及对AI产业链的整体影响以及产业化落地可能性。
▍技术逻辑:GPT-3.5基础上基于人类反馈学习进行额外训练,给出了Transformer模型未来的发展方向。
OpenAI团队从 GPT-3.5 系列中的一个模型进行微调,使用与InstructGPT相同的方法,即人类反馈强化学习(RLHF)训练该模型,并对数据收集设置相对做了优化。从最终结果看,Chat-GPT仅仅使用了精选的百亿级别参数(对比GPT-3的千亿级别参数)就完成了与GPT-3结果相当甚至更好的回复质量,凸显了数据质量的重要性,大模型可能将告别过去一味堆叠数据量大小的时代。Chat-GPT的成功是在前期大量坚实的工作基础上实现的,不是横空出世的技术跨越。模型找到了一种面向主观任务来挖掘GPT3强大语言能力的方式,让模型“解锁”(unlock)和挖掘GPT3学到的海量数据中的知识和能力。因此从这样的底层技术逻辑出发,我们能迅速找到中短期内适合Chat-GPT的产业化方向:一个真正全方位的智能内容生成助手。
▍AI产业影响:算力成本下降+高质量数据催生底层应用,模型开放成为未来趋势,并加速迭代效率。
Chat-GPT的成功证明了两点:1)单纯扩大模型参数并非唯一出路;2)让模型在早期开放给大众测试并收集人类反馈数据更有利于模型迭代。在近10年AI发展的前两个阶段,人工智能的进展更多体现在基于规模的技术突破,如2015-2020年,用于模型训练的计算量增长了6个数量级,同时随着规模的增大,输出结果的质量亦迎来质变,在语言文字、书写、图像识别等领域皆表现出超越人类的水平。但在实用层面,由于所需要的算力巨大,往往需要特殊的GPU配置,同时训练过程相对封闭,大多数人并无法使用,因此技术无法被多数人触达。而人工智能的第三个阶段,随着更新的技术、更优的算法、更大的模型出现,算力的成本越来越低,使得模型训练与运行所需成本持续下降,而算法从封闭测试到开放测试、开源的逐渐普及,亦降低了使用门槛。由此人工智能无论在经济性与可获得性上都达到了支持普及的水平。得益于AIGC基础设施可获得性的逐步提高,平台层变得更加稳固,算力成本持续下探,模型逐渐趋于开源与免费,应用层爆发式发展的节点正在靠近。
▍应用场景:实现从UGC到AIGC的助推器。
目前我们正经历从Web2.0开始向Web3.0转型的启航阶段,我们已经看到内容创造从专业创作(PFC)转型为了用户创作(UGC)。而Chat-GPT的出现以及中短期内的产业化落地将会为从用户创作(UGC)到AI创作(AIGC)的转型提供关键的辅助支持。结合Chat-GPT的底层技术逻辑,我们认为Chat-GPT中短期内产业化的方向主要分为四大板块。
1)Chat-GPT对于文字模态的AIGC应用具有重要意义,在归纳性的文字类工作中展现出了极其优异的表现。中短期内Chat-GPT能在办公辅助类工具中迅速落地,例如会议总结、文件翻译、例行报告等,提升办公效率并节省人力成本。
2)代码开发相关的工作更加规整也非常适合AI辅助生成。2021年中与Github、微软合作上线的Copilot是目前最成熟的AI代码补全工具,根据Github数据,测试一年来已有120万用户,这些用户编写的代码中40%是由Copilot自动生成,而截至2022年10月,Copilot已经融资2200万美元。Chat-GPT在目前测试中表现出的代码生成能力相比于Copilot更加灵活,但欠缺一些底层的稳定性。在进行针对性的优化后,基于新GPT模型的AI代码辅助工具也有望在中短期内落地。
3)图像生成领域成为了2022年下半年一级市场公司布局的热点,随着Dalle2的热度,在商稿方面用AI取代人类画手的思路基本明确。GPT模型在图像生成领域目前效果略逊于扩散模型,但扩散模型可以利用Chat-GPT生成较佳的Prompt,对于AIGC内容和日趋火热的艺术创作,提供强大的文字形态的动力。
4)Chat-GPT最适合直接落地的项目就是智能客服类的工作。根据模型现有的完成度,在垂直行业针对性的做人工反馈训练,Chat-GPT就可以落地为智能客服产品,在toC场景中率先应用。对比目前的智能客服,Chat-GPT支撑的客服将在灵活性与人性化服务方面有显著的进步。
▍风险因素:
AI核心技术发展不及预期风险;科技领域政策监管持续收紧风险;全球宏观经济复苏不及预期风险;宏观经济波动导致欧美企业IT支出不及预期风险;全球云计算市场发展不及预期风险;企业数据泄露、信息安全风险;行业竞争持续加剧风险等。
▍投资策略:
Chat-GPT模型的亮眼表现的背后是研究者在Transformer模型前进的道路上发现了类反馈强化学习这一方法带来的潜力,对产业界AI的发展而言,数据质量的优化、AI研究人员的储备与计算能力将是未来能否走在AI应用前沿的核心能力。Chat-GPT的成功证明了Transformer模型并非陷入困境,不断的AI技术方法上的新突破正驱动全球AI产业进入加速发展阶段,叠加AI产业集群效应的不断凸显,AI产业有望成为全球科技领域中期最具投资价值的产业赛道之一。AI产业有望继续保持“芯片+算力基础设施+AI框架&算法库+应用场景”的稳定产业价值链结构,拥有完整数据闭环结构、良好数据自处理能力的企业有望持续成为产业受益者。
来源:金融界