GPT-3.5 (GPT-3 的改进版)模型的变体。ChatGPT 可以在对话中根据上下文形成类似人
类的文本响应,与其他使用预定义的响应或规则生成文本的聊天机器人不同,ChatGPT 可
以根据接收到的输入生成响应,从而生成更自然、更多样化的响应。ChatGPT 不仅是聊天
机器人,还能进行撰写邮件、文案、代码等任务。从 2022 年 11 月上线以来,在 ChatGPT
上的累积用户已经达到 1 亿。
1)回答的真实性
ChatGPR 可能会写出看似合理但不正确的答案。这主要是因为模型进行强化训练
(Reinforced Learning)时,缺乏真实信息来源。另外,为了提高模型的严谨性,模型会
拒绝回复部分它能正确回答的问题。同时,监督训练会误导模型,由于模型产生的答案是
基于模型的认知而不是人类标注师的认知。
2)数据量级和算力门槛影响模型的实时性
ChatGPT 学习的数据库停留在 2021 年, 由于模型的数据量级大(GPT-3 1750 亿参数,
使用 800GB 数据进行训练),加入标注数据训练让实时数据的引入非常困难,重新预训练
模型的成本也高(单次几百万美元以上),导致 ChatGPT 对于 2021 年后发生的事情的了
解有限。
3)回答内容存在偏见或有害指令
ChatGPT 使用了“人类反馈强化学习”(RLHF)的训练方法。首先,预训练的模型在少量已
标注的数据上进行调优,随后让预训练好的模型(SFT)针对新问题列表生成若干条回答,
并让人类标注师对这些回答进行投票,以创建一个由比较数据组成的新数据集。在此数据
集上训练新模型(Reward Model, RM)。RM 模型用于进一步调优和改进 SFT,并将最后
两个步骤反复迭代以获得最终的模型。
这个方法有明显的局限性,用于 fine-tuning 模型的数据会受到人工标注者的偏好和偏差影
响,标注者通常对模型输出的排名持不同意见,RLHF 的方法假设所有人都有相同的价值
观,这导致 ChatGPT 导出的内容可能存在偏见。
智能客服、教育培训、金融等),助力行业降本增效的同时,开拓创新变现增量。
场景应用:搜索+智能客服先行,内容创作+文娱生活加速落地,长期 B 端
产业升级可期
我们看好 ChatGPT 在搜索引擎的协同和能力加强,多项回复展示更好满足用户信息获取,
智能创作、编程、分析等能力助于提高搜素转化率。考虑当前 ChatGPT 信息基于离线非实
时数据库、训练模型下答案非正确、成本过高,我们预计 ChatGPT 较难取代搜索引擎,更
多体现在赋能优化。电商领域,ChatGPT 有望在智能客服领域通过大模型通用智能能力完
善人机对话丝滑度和专业答疑。期待 ChatGPT 未来在代码机器人、翻译、文学创作、媒体、
教育培训、家庭陪护、金融等领域加速落地。文字之外,AIGC 也将在内容创作、数字经济、
产业升级层面带来变革,中期电商、传媒、娱乐、影视等领域加速渗透机会显现,长期看
好 AIGC 推动 B 段医疗、工业、金融等产业升级(例如:合成数据)。
变现空间: AIGC 万亿市场可期,订阅付费加速商业化,MaaS 探索长期增长点
下一代互联网业态对内容产出效率、内容消费的蓬勃需求,将驱动 AIGC 快速发展。结合
Gartner 及 Acumen Research and Consulting 预测,2025 年 AIGC 渗透率将达 10%,至
2030 年 AIGC 市场规模达 1108 亿美元 (对应 2021-2030 年 CAGR 达 34%)。其中,对话式
AI 预计 2030 年市场规模达 34 亿美元 (vs. 2021 年 5.2 亿美元)。当前 AIGC 企业变现模式
主要为:订阅付费(每月订阅)、按量收费(数据请求量、计算量、图片张数、模型训练次数
等),未来 MaaS(模型即服务)有望复制 SaaS 企服路线迎来需求爆发奇点 (海外 Hugging
Face 已成型)。
阿里、字节;可同时关注近期推出类ChatGPT服务或泛AI产品的垂类腰部平台,如网易、
知乎、阅文、昆仑万维等。我们看好百度在 ChatGPU 及 AIGC 的全栈技术储备、搜索引擎
协同及产品管线,受益于:1)文心一言待推出,数字人+智能创作应用矩阵丰富;2)文
心大模型技术支持及海量数字资产优势 (语料库、参数量大)。
来源:招银国际
报告目录如下:
ChatGPT 跨行业专题报告完整版下载https://www.hereitis.cn/articleDetails/1193