在经历过去半年热闹甚至癫狂的「百模(型)或千模(型)大战」之后,2023 年 8 月最后一天中国大模型市场的一系列变化,注定将改变这个领域未来的竞争态势。
这其中,作为首批通过相关部门备案的百度文心一言格外引人瞩目。在资本市场,官宣文心一言正式开放服务后,百度美股当地时间周三上涨 4%,港股中的百度也一度大涨 5%。
在应用商店,中国地区用户对于大模型应用的热度也异常高涨,根据百度官方给出的数据,仅仅用了不到 12 个小时,百度「文心一言」成为苹果 App Store 中国区免费应用第一,这也是首个登顶 App Store 榜首的中文 AI 原生应用。
官方认可、资本市场响应与消费者的热情,构成了 2023 年 8 月最后一天中国大模型市场的三大关键词,兼具三大关键词的文心一言,也是中国最早发布的大语言模型之一。通过复盘文心一言过去几个月的发展状况,或许可以成为观察中国大模型市场乃至 AI 未来走向的切入口。
去年 11 月横空出世的 ChatGPT,尽管在技术层面并没有太多真正意义的创新,但展示了利用高质量训练数据叠加用户交互反馈后的巨大威力。由此也形成了一个看似简单但实用的闭环:用户越使用它、它的训练数据越多、模型输出的结果越符合用户需求、用户使用次数继续增加。
这构成了消费市场大模型应用的两重价值:其一是快速占领用户心智,让用户适应大模型的交互模式与使用逻辑;其二是构建海量、高效的数据反馈机制,进一步提升模型能力。
由此也不难理解,为何消费市场大模型应用呈现出如此激烈的竞争态势:微软快速整合 ChatGPT 打造出新 Bing、Google 同时押宝 Bard 和 SGE 等大模型相关应用、苹果会因为迟迟不发布相关应用而屡屡受到华尔街分析师与科技媒体的质疑。
百度文心一言亦是如此。
作为几乎全球最早发布类 ChatGPT 应用的科技大厂,百度的确有实力支撑起一款面向千万甚至亿级消费者的 AI 应用。一方面,百度在 AI领域拥有长期的技术积累,横跨芯片、深度学习平台、模型等多个领域,文心一言的基础模型现已升级到文心大模型3.5,文心大模型1.0发布于 2019 年,是中国首个知识增强大模型。
此前,百度首席技术官王海峰曾分享过文心一言的关键技术,包括 SFT(有监督精调)、RLHF(人类反馈的强化学习)、Prompt(提示)、知识增强、检索增强和对话增强。如果说前三项是 GPT 类模型的通用技术,那么后三者则是百度自身技术积累的体现,比如知识增强,既可以将原有知识「内化」进模型参数里,还能让大模型调用外部知识。
另一方面,百度是最大的中文搜索引擎,并且积累了世界上最大的多源异构知识图谱,为大模型提供数万亿数据和数千亿知识,能够为文心一言的成长提供足够「燃料」。自 3 月发布以来,文心一言的成长速度非常快,根据百度给出的数据,目前熟练掌握的创作体裁超过 200 个,内容丰富度是发布初期的 1.6 倍,思维链长度是初期的 2.1 倍,知识点覆盖达到初期的 8.3倍,更是在诸多场景可以提供比 ChatGPT 更好的答案。
用户是检验一切的标准,最新数据显示,文心一言上线首日就有超过 3300 万个提问,火爆程度可见一斑。
某种意义上说,消费市场大模型应用就是一个大模型最佳实践案例,在此基础上,科技公司需要将自己在大模型领域的各项能力与众多行业需求相结合,从而构建起更多大模型应用。
在美国,OpenAI 一方面推出付费版本的 ChatGPT Plus,另一方面又通过开放 API 和推出调参企业版本争取更多行业客户,以此形成 ChatGPT 赋能行业的竞争力。而在中国,过去几个月,百度已经在插件生态、大模型社区等领域构建起了新竞争优势。
比如,百度为开发者提供的低门槛的插件开发工具集(ERNIE Bot SDK),支持信息服务类、工具类、基于大语言模型创新类等多类型的插件开发。插件开发完成后,可直对接文心一言大模型。
再比如,百度拥有中国最大 AI 社区「飞桨 AI Studio」(星河社区),目前拥有 609 万个开发项目。在此基础上,百度构建了星河大模型社区,可以为开发者提供一体化大模型开发体验,并鼓励开发者进行交流与互动。根据公开数据,截止目前,星河大模型社区已积累超 300 个大模型创意应用。
更重要的一点,全球 IT 技术竞争全面步入「芯片、框架、模型、应用」四层架构,每一层架构都有较高的技术门槛和巨大产业机会,如芯片层的英伟达、AMD,模型层的 OpenAI、Anthropic 等。
百度也有属于自己的「壁垒」,在各个层面拥有大量自研技术积累,包括昆仑芯片、飞桨深度学习平台、文心大模型以及百度搜索等应用。层与层间的反馈既能有效降低大模型产品的运营成本——要知道 OpenAI 一天的成本高达 70 万美元,又能有效提升模型迭代速度。相比于其他专注于模型的公司,百度更有潜力建立起自己的「护城河」。
中国市场需要中国的大模型产品,这是全球 AI 竞争白热化背景下的行业共识。在经历了过去几个月的炒作浪潮之后,文心一言等一众大模型产品脱颖而出,借助监管部门的这声发令枪响,中国大模型竞争正在进入到一个全新阶段。
而在这一众选手里,从率先开始内测到首批向公众提供服务,从基于长期投入到快速构建开发者生态,文心一言已经拥有了不小的领先身位。不过也必须看到一个事实,中国乃至全球大模型的竞争才刚刚开始,未来围绕技术、生态与应用的竞争还在持续迭代,这是文心一言等中国大模型产品的挑战,也是新的发展机会。
下一个圈道,谁会成为新领跑者?不妨拭目以待。