大语言模型丨研究报告
导语:
ChatGPT这一现象级突围产品的横空出世,拉开了大语言模型产业和生成式AI(AIGC)产业蓬勃发展的序幕。海外市场,OpenAI、微软、谷歌、Meta等巨头动作频频。中国市场也百花齐放:百度、阿里、华为、腾讯、360、商汤、京东、科大讯飞、字节跳动等巨头厂商结合自身业务及战略布局,陆续宣布研发或已发布大语言模型产品;垂直赛道及大模型解决方案厂商则锚定一个或多个行业领域,意图打造“数据飞轮”护城河;应用层厂商则积极试水整合大模型能力,提升产品功能;众多科技大佬也宣布进军大模型领域进行创业。市场热度高涨,中国人工智能产业迎来了难得的发展契机。
在热潮背后,产业的可持续发展,各类参与者的机会和价值点值得深思。艾瑞据此发布本篇报告,将着重分析,“ChatGPT的成功之路”、“中国类ChatGPT产业发展趋势”、“ChatGPT应用场景与生态建设”、“ChatGPT浪潮下的‘危’与‘机’”四个问题。聚焦国内市场,辨析中国自研通用基础大语言模型的重要意义、分析中国大语言模型产业参与角色分化路径及原因、梳理呈现中国大语言模型产业受益链图谱、辨析大语言模型对数字产业生态的重要价值。
当然,在大语言模型的优秀表现中也隐藏着社会各界对可信、数据与隐私安全、滥用风险、伦理等问题的疑虑。但毋庸置疑的是,大模型产业的蓬勃发展将助力AI工业化进程、变革海量应用交互方式、创造数字产业新的增长空间。从国家、企业到个体都需立足长远,迎接AIGC与通用人工智能(AGI)时代的到来。
• 讨论1:OpenAI ChatGPT的成功之路
核心观点:ChatGPT在说好“人话”上的优异表现,远远超出了大众对于一款聊天机器人的预期,也标志着通用基础大模型的落地突破。OpenAI的成功则是一场初心+资源(数据、资金、算力、人才等)加持的长期主义胜利。
ChatGPT——生成式AI里程碑
生成式AI的重大突破,通用基础大模型的胜利
相比之前的生成式对话产品,ChatGPT (Chat Generative Pre-trained Transformer )在大范围连续对话能力、生成内容质量、语言理解能力和逻辑推理能力上都得到大幅提升,是生成式AI(AIGC)极为关键的发展节点。“Chat”指向它的功能,“Generative”代表它属于生成式算法。生成式算法在过去数年中受制于RNN的内生缺陷始终发展缓慢,直到2017年 “Transformer”架构出现并解决了传统RNN模型的问题,生成式AI才开始在预训练的Transformer架构之上焕发生机,NLP、CV甚至多模态领域通用基础大模型飞速演进。在模型参数量几何级数增长以及多种训练方式的探索之中,ChatGPT横空出世,也标志着通用基础大模型将突破NLP领域以小模型为主导的传统发展范式。
探秘ChatGPT的能力从何而来?
RHLF指令精调+能力涌现,让大模型说好“人话”
成功背后:秉承初心+巨量资源
不仅是多种关键要素的聚合,更突显方向与路径的重要性
ChatGPT的成功是一场初心+资源加持下的长期主义的胜利,GPT模型正是在密集烧钱策略后出现的,而ChatGPT这一明确指向商业化的产品则显然受到OpenAI从非营利向半营利转型的发展路径影响。
技术能否赶超ChatGPT?
存在赶超机会,但中外差距短期难以追平
与ChatGPT功能对标的大语言模型(Large Language Models, LLMs),目前国外主要有Google推出的Gopher、LaMDA以及Meta的Llama等;国内为百度首发的“文心一言”、360发布的大语言模型、阿里发布的“通义千问”、商汤发布的“商量”等。虽从对话和文本生成的直观体验看ChatGPT略胜一筹,但对于Google等国外大厂而言,克隆ChatGPT并不存在太高壁垒,当前暂时落后主要是出于公司战略与技术理念差异,选择了不同技术路线,随着各家探索成果和新技术方法的实践不断推进,仍存在对GPT系列模型赶超的可能。对百度等国内大厂而言,则在数据、算力、工程化能力等关键要素上存在短板,短期内难以对国外领先大模型实现赶超,为跟随者角色,长期更需要国内AI全产业链整体进化。
大语言模型厂商商业化路径
服务于各公司战略业务拓展,形成差异化商业路线
商业模式上,ChatGPT已经明确指向API、订阅制和战略合作(嵌入微软Bing、Office等软件)三种营收方式,且已在用户数据积累、产品布局和生态建设层面充分领先;Google虽有意追赶,但由于聊天机器人这样的产品形态对于其主营的搜索引擎业务的助益有限,因此在与搜索引擎结合方面较为审慎,更希望借助大模型能力开展“模型即服务”范式,开拓其当前市占率较低的云服务业务的市场空间。作为国内大模型的标杆企业,百度的选择与Google更为类似,“文心千帆”产品剑指B端市场,意图带动云服务营收。
• 讨论2:中国类ChatGPT产业发展趋势
核心观点:中国大语言模型(LLMs)产业或将分化出通用基础大模型、垂直基础大模型、应用开发和工具层厂商四大类。在全球政治经济局势下,自主可控是保障网络安全、信息安全的前提,自研基石模型具有高度战略意义。可以大胆假设,未来若形成大模型能力领先,谁就更有可能拥有从应用层到算力层的营收话语权。
中国自研通用基础LLMs的重要意义
大厂的绝对战略优先级,但也是一场重投入的持久战
2023年3月中,OpenAI宣布ChatGPT整合GPT4,实现多模态交互、大幅提升复杂长文本理解与生成能力、可控性增强,引起全球科技界震动。在国内科技及投资各领域的高度关注下,百度举办了“文心一言”产品发布会,虽说从产品功能、成熟度、支持用户并发等维度距ChatGPT还有不足,但也是中国在这新一轮“科技军备竞赛”中的勇于尝试与发声,目前百度也已启动API接口开放测试,瞄准B端市场。紧随其后,360、阿里、华为、商汤、京东、科大讯飞、字节跳动等巨头企业也动作频频。从自研通用预训练大语言模型的必要性角度分析:在全球政治经济局势下,自主可控是保障网络安全、信息安全的前提,自研基石模型具有高度战略意义;从自研的可行性角度分析:基于前文讨论的通用基础LLMs研发所需的算力、数据、算法、人才、资金储备等,中国仅有少数头部互联网企业具备研发“入场券”。宣布入局的头部企业基于自身业务生态选择的战略路线也不尽相同。但可以大胆假设,未来若形成大模型能力领先,谁拥有通用基础大模型与生态和流量入口,谁就更有可能拥有从应用层到算力层的营收话语权。
中国LLMs产业厂商类型与定位逻辑
垂直基础大模型厂商与应用开发厂商需在窗口期加快建立“数据飞轮”壁垒
此轮基于ChatGPT的大模型浪潮兴起伊始,结合我国AI产业链与竞争格局现状,一种判断是:基于大模型的通用和泛化性提高,未来手握通用基础大模型的巨头企业会逐渐侵蚀垂直领域厂商业务。这种压力长期来看的确存在,但大模型与产品结合,尤其在非检索或开放域交互等场景中,需要依赖垂直领域数据和行业know-how、应用场景和用户数据反哺、一站式端到端工程化能力等。在此窗口期,垂直领域与应用层厂商应积极将大模型能力整合入自己的技术栈,服务于产品功能优化,建立“数据飞轮”壁垒。在下游丰富的基于大语言模型、AIGC应用开发需求的影响下,还将分化出一类工具型或平台型厂商,主要提供基于各类大模型的开发平台服务,帮助客户实现便捷的AIGC应用开发与落地。
中国大语言模型产业价值链
产业加速发展中,产业价值链格局初显
• 讨论3:ChatGPT应用场景及生态建设
核心观点:大语言模型产品通过变革人机交互方式、丰富下游应用产品种类、塑造“模型即服务”的新兴商业模式、构建超级应用的新兴生态平台入口等,改变数字产业生态。以ChatGPT为例,其在搜索引擎与各类工具软件中率先掀起应用热潮,ChatGPT Plugins则触发生态建设开关,为国内参与者提供落地参考。此外,基于政府及大中型企业对私有化部署的强需求,自研大模型对我国以数据为要素的价值生产具有重要意义。
大语言模型落地应用对数字产业影响
变革交互方式、丰富产品种类、塑造新兴商业模式、构建生态平台
1)变革人机交互方式:既有软件将接入对话能力,交互界面发生变革,自然语言成为用户发布操作指令的新模态。这一影响将从搜索引擎等知识信息平台拓展到一切人机交互型应用。友好度和功能性的显著提升将激活软件服务的增量用户市场;2)丰富产品种类:将诞生新一批AI-first的应用,如创意设计、AI营销、AI运营等领域;3)塑造新兴商业模式:AI主导的“模型即服务”商业逻辑将重构应用开发流程,传统企业可享受低成本构建应用模型的便利;4)构建新兴生态平台:超级应用的出现,本质上搭建了用户需求与各类信息服务之间的基于自然语言交互的平台生态,塑造了移动互联网后新的流量入口。
ChatGPT引领AI应用热潮与应用革命
应用革命序幕拉开,应用渗透不断加剧
ChatGPT被称为AI的“iPhone时刻”,以ChatGPT为代表的生成式AI让每个人命令计算机解决问题成为了可能。可对生产工具、对话引擎、个人助理等各类应用,起到协助人、服务人甚至超越人的角色。凭借此革命性突破,ChatGPT在搜索引擎与各类工具软件中率先掀起应用热潮,引起了广大用户对ChatGPT相关技术的关注与学习。海量下游应用也因此捕捉到新的技术与产业机会,希望通过各类大模型与工程化能力,将类ChatGPT产品能力输送到原有的应用中,关于应用革命的序幕就此拉开。
应用示例:通用搜索引擎
互动溯源的新搜索方式,各搜索引擎企业对标微软布局加码
集成了ChatGPT版搜索引擎的New Bing改变了检索引擎的内容呈现逻辑,用户在短时间内可获取更可靠、更完整、更具备创意的答案,且因接入实时网络数据同时满足对数据实时性要求。凭借全新的搜索体验,New Bing收获了较大的用户流量。与此同时,谷歌与百度虽均发布了与ChatGPT对标产品,但并未直接嵌入搜索引擎中,不过谷歌正在测试几款集成了类ChatGPT对话式功能的新搜索产品;360作为国内搜索引擎追赶玩家,发布大模型产品并整合入搜索产品中,意图抢占用户流量。
应用示例:办公生产工具
基础办公软件革新,定价与买单情况尚未落实
2023年3月17日,微软正式发布 Microsoft 365 Copilot,将GPT-4与ChatGPT能力融入了Office 365全栈生产力工具,并推出汇集了Office 365数据的Business Chat功能,较大提升了数字化办公的智能化水平,可有效解放重复性的基础办公劳动力。现阶段,产品计划采用增值收费模式,但价格尚未确定;且产品应用中仍存在偶发错误问题,用户是否会持续为该类产品买单存疑。目前能与微软Microsoft 365 Copilot对标的成型产品为谷歌的Workspace,国内的金山办公正在围绕AIGC与LLMs领域进行类似产品功能的研发。
应用示例:对话式AI
接入“高知、高情商大脑”,避免对话的知识与情感障碍
在ChatGPT出现以前,文本机器人、语音机器人、多模态数字人等对话式AI产品普遍存在知识结构不完善、只能做简单问题回答、语义与情感理解不到位等问题,较大程度上拉低了用户的交互体验感。将对话式AI与大语言模型产品结合,相当于给对话系统安装了一个更富有人类知识、智慧、情感的大脑,可改善以往对话式AI的产品痛点,完善产品功能,添加产品新卖点。
应用示例:企业服务与垂直领域应用
B端海量应用需求待满足,G端尚处于尝试及观望期
在B端企业服务应用中,类ChatGPT产品可嵌入原有企业服务进行升级,包括知识检索、数据分析、辅助编程、数字员工、交互硬件、数字人等企业级应用都将被重构。G端市场则相对特殊,虽存在大量潜在高价值应用场景和未满足需求,但基于自主可控、私有化部署与可信AI需求,以及“数据烟囱”导致的高质量数据资源匮乏,使现阶段G端应用还处于观望期。但国家大数据局的成立,将加快我国政务大数据管理与体系建设。而未来自主可控的大模型对我国以数据为要素的价值生产具有重要意义。
ChatGPT Plugins触发生态建设开关
• 讨论4:ChatGPT浪潮下的“危”与“机”
核心观点:各类大语言模型及AIGC相关产品可能诱发的风险不容忽视,但少数人的“叫停”并不能减缓商业巨头和产业生态的推进步伐。同时,作为新兴科技生产力,ChatGPT成为科技封锁和保护主义对象的趋势也初现端倪。我国参与者需立足长远战略,布局大模型技术研发、商业落地、生态建设与产业治理。基于我国企业在模型层和应用层的百花齐放,“建立生态平台+做厚应用服务”有望打造中美大模型产业博弈的弯道超车机会。
AIGC的“达摩克里斯之剑”疑问
技术自身限制+用户使用不当虽会产生风险隐患,但不可因噎废食
2022年底至2023年3月,全球科技界都在为此轮生成式AI热潮狂欢,提振AI产业发展信心的消息层出不穷:美国科技企业或布局追赶或投身下游应用开发与生态集合;中国企业也积极布局类ChatGPT、类Midjourney产品开发,国内巨头纷纷公开大模型研发进展与计划。但在一片欣欣向荣中,渐渐也有反对的声音出现:“ChatGPT取代人类”、“AI Risk下ChatGPT的叛逃”、“LLMs助推欺诈和恐怖主义”、“打开AGI潘多拉魔盒”等讨论甚嚣尘上。3月29日,作为OpenAI曾经最重磅的支持者及联合创始人,世界首富马斯克与多位科研界大牛发表联名声明,基于伦理与设计安全标准考虑,呼吁“所有AI实验室立即暂停训练比GPT-4更强大的AI系统至少6个月”将反对声推向高潮。大模型开发与应用企业也已认识到治理的重要性,例如通过RLAIF(减少人类反馈信息)、去除危险内容生成、监管框架等手段解决模型偏见、滥用等风险问题。OpenAI也于4月6日发布《Our approach to AI safety》,应对安全和伦理质疑。作为突围性产品,ChatGPT的革新价值已被充分印证。而AIGC技术也并非是“悬顶之剑”,围绕其风险与伦理问题的讨论与解决方案探索,将助推产业可持续发展。
围绕新兴科技生产力的国家博弈
GPT模型成为科技封锁和保护主义对象的趋势初现端倪
国家层面对于目前世界上最优秀(从用户生态到商业落地层面评估)的AIGC公司——OpenAI和其核心产品ChatGPT的态度也比较慎重。比如,意大利宣布封禁ChatGPT并限制OpenAI处理意大利用户信息;我国A股多家企业也发布公告披露“公司未与OpenAI开展合作,ChatGPT的产品和服务未给公司带来业务收入”。同时,ChatGPT平台也封禁大量OpenAI账户,其中包括部分使用中文进行对话的用户。作为新兴科技生产力, ChatGPT成为科技封锁和保护主义对象的趋势初现端倪。从我国所处的追赶者角色看,类ChatGPT产品及其下游应用产业对于国家数字经济发展的战略意义不容忽视。半导体产业“卡脖子”的前车之鉴发人深省,OpenAI的成功再次暴露了中美两国不仅在AI算力层面差距巨大,在AI算法和底层框架等层面也存在代际差距。我国AIGC产业发展需立足长远战略,布局大模型技术研发、商业落地、生态建设与产业治理。
迈向AGI时代的畅想
通用人工智能(AGI)又称强人工智能,指具备等同或超过人类智能行为水平的人工智能。ChatGPT的面世打开了通向AGI之路。微软发布报告称GPT-4已明显超越ChatGPT,在很多任务上已经达到人类水平甚至超越人类表现。AGI时代正在加速到来,“人工智能将淘汰人”的论调加剧了个体焦虑与危机感。但其实生产力工具与人关系的底层逻辑并不是简单地替代,而是通过改变对个体的能力评价体系,产生人的价值分层。未来,传统的“掌握通识知识、流程性工作能力等”要求会逐步成为隐藏的底层要求,更显性、高层次的要求则是“创造性价值以及高效利用工具解决问题”的能力。面对巨变,人类除了摒除焦虑、拥抱变革外,也的确应该心存敬畏。
本文来自微信公众号“艾瑞咨询”(ID:iresearch-),作者:艾瑞,36氪经授权发布。