贝克街探案官
作者:车行运
AI的星辰大海,百度的时代即将到来
自从ChatGPT爆火之后,全球AI企业纷纷推出自家研发的同类产品,其中进度最快的当属百度。
根据百度公众号2月28日发布,百度计划于3月16日14时在北京总部召开新闻发布会,主题围绕公司旗下的大语言模型文心一言。百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰将出席。
对于百度而言,文心一言绝不是跟风蹭流量,而是公司多年技术沉淀积累的必然结果。毕竟大语言模型不是一朝一夕就能做出来的。
过去十余年,百度深耕人工智能领域,目前已经拥有芯片、框架、模型和应用四层技术栈,基础能力完全具备、具有综合优势,不仅能够实现整体持平ChatGPT,甚至还有机会做到局部超越。超越部分包括知识增强、检索增强和对话增强。
01 什么是大模型
百度2010年转型AI时,就曾畅想过类似ChatGPT的使用场景。
在2019年,百度正式推出文心大模型,至今已经多次迭代,从单一的自然语言理解延伸到多模态,包括视觉、文档、文图、语音等多模态多功能,因此“文心一言”所基于的ERNIE系列模型也已经具备较强泛化能力和性能。
在模型层,文心大模型已经包括36个大模型,涵盖基础大模型、任务大模型、行业大模型的三级体系,全面满足产业应用需求,构建了业界规模最大的产业大模型体系;在工具与平台层,通过大模型开发套件、文心API和提供全流程开箱即用大模型能力的EasyDL和BML开发平台,全方位降低应用门槛;产品与社区层,包括AI艺术与辅助创作平台“文心一格”、产业级搜索系统“文心百中”和旸谷社区,让更多人零距离感受到最先进的AI大模型技术带来的新体验。文心是百度自主研发的产业级知识增强大模型,全景图由模型层、工具与平台层、产品与社区层构成。
值得一提的是,2021年12月,百度与鹏城自然语言处理联合实验室发布全球首个知识增强的千亿AI大模型——ERNIE3.0Titan。ERNIE3.0Titan拥有2600亿的参数,参数量较GPT-3的1750亿多出48.6%,在复杂知识推理能力上较GPT-3提升8个百分点。ERNIE3.0Titan已在60多项的NLP任务上取得了世界领先,在Super GLUE和GLUE都超过了人类排名第一的水平。
ERNIE3.0与GPT系列相比,其最大特点在于采用多范式统一的大规模预训练框架,融合了自回归网络+自编码网络,并在训练时引入大规模知识图谱类数据。时至今日,百度文心一言已经与近500家头部企业达成合作,行业覆盖互联网、媒体、金融、保险、汽车、企业软件等。
而且和ChatGPT相比,前者由于其背后公司的局限性,在中文领域使用体验远不如英文,百度占据地利优势,正如李彦宏所说,百度的文心大模型是中国市场非常本土化的大语言模型,这意味着百度现在正在研发的文心一言,将比国外开发的模型更适合中文和中国市场。
正如中国数实融合50人论坛智库专家、国研新经济研究院创始院长朱克力所说:在AI大赛场的主赛道中,百度已占据国内赛道第一身位。这也回答了,为什么在全球群雄争霸的背景下,依旧是百度最先推出了大语言模型文心一言。
02 文心一言能带来多少改变
在今年2月的AI+工业互联网高峰论坛上,百度智能云宣布“文心一言”将通过百度智能云对外提供服务。
百度智能云采用云智一体架构,以云计算为基础,以AI为抓手,借助百度大脑、飞桨平台等对传统生态输出AI能力,为企业和开发者提供全球领先的人工智能、大数据和云计算服务。
值得注意的是,大语言模型接入智能云,将直接改变云市场游戏规则。云服务从数字时代跃迁至智能时代,之前选择云厂商更多看算力、存储等基础云服务,未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用之间的协同。这一趋势下,百度“云智一体”战略也将体现出更强竞争力,百度智能云有望进入新一轮高质量增长周期。
按照规划,文心一言会率先落地在百度搜索。在李彦宏看来,文心一言将重塑信息的生成和呈现方式,推动搜索体验的代际变革,并作用于百度移动生态服务场景与市场规模的扩大。一方面带来更好的搜索和答案,另一方面提供全新的交互和聊天体验,以及独特的生成内容,极大地丰富内容生态和供给,吸引更多用户,并有机会形成新的流量入口。
根据百度财报,公司现阶段经营利润和现金流的重要来源依旧是百度移动生态,其中2022年第四季度移动端搜索查询次数和信息流分发量继续实现同比两位数的增长。今年12月,百度App月活跃用户达到6.48亿,同比增长4%。
百度移动生态能保持如此稳定的增速,主要得益于公司长期稳定的研发投入,根据百度财报,2022年百度核心研发费用214.16亿元,占百度核心收入比例达到22.4%。2022年四季度,百度研发投入为56.58亿元。
回顾百度转型AI至今的十多年里,即便是在最困难的时候,公司在缩减预算的时候,百度唯一不变的一个前提,就是绝不减少技术投入。公司创始人李彦宏不止在一个场合强调,如果百度只有一块钱,也会投到技术里。
这绝不是李彦宏一面之词,在2021年中国民企500强名单中,百度位列技术研发强度排名第一,保持着高达23%的研发投入。
正如“互联网+百人会”发起人张晓峰所说:当一家科技企业连续十二年将营业额的15%以上投入人工智能研发,我们值得认真听取他们的声音。这是上万科技人、数千亿投入厚积薄发的“科技的声音”。
当一家企业持续打造开发者开源生态、协同创新生态、各得其所产业生态,追随者、协同者会逐步破除疑虑、拥抱生态大协同,这是“生态的力量”。
百度能在这波AI潮中迅速反应并整合已有技术框架及模型,成为国内最先官宣产品模态的民营企业,这属实是行业佼佼者。
03 常年积累铸就文心大模型
正如前文所述,文心大模型的问世需要长期积累,在公司转型AI后,百度于2013年正式开始深度学习技术的投入,2017年百度还牵头筹建了深度学习技术及应用国家工程实验室,2021年升级为研究中心,这也是中国唯一一个深度学习国家级研究中心。
基于这个研究中心,百度打造了中国首个自主研发、开源开放的产业级深度学习平台飞桨。飞桨包含了核心的开发框架,包含完善的训练,推理,部署能力,有丰富的基础模型库,端到端的开发套件和工具组件。考虑到用户需求,还分别提供了零门槛AI开发平台EasyDL和全功能AI开发平台BML,同时还有AI Studio学习与实训社区来帮助开发者成长。
现在来看,飞桨有大量在产业实践当中沉淀出来的模型,并提供官方的支持,能够保证开发者的应用效果是最佳的、真正可靠的。为了降低产业应用人工智能的门槛,实现最后一公里的适配问题,飞桨和30多家芯片厂商进行了适配,极大的降低了企业应用人工智能的门槛。飞桨还提供大规模分布式训练能力,可以支持超大模型的训练任务。
经过多年的投入,目前飞桨在中国深度学习市场应用规模第一,拥有庞大的生态体系,截至2022年11月,有535万开发者,20万家企事业单位,创建了67万个模型。
可以说飞桨是我们训练大模型,打造文心大模型,以及未来即将上市一言的坚实基础。没有这样一个稳定可靠,性能极致的深度学习平台,那么是很难打造中国自己的大模型能力的。
大模型的主要作用就是解决重复数据标注的麻烦,需要通过学习大量无标注的数据来做预训练,增加整体模型前期学习的广度和深度,这样可以提升大模型的知识水平,就能降低成本,从而提高适应性,提升大模型在后续任务中的应用效率。
在实际操作过程中,预训练大模型在基于海量数据的自监督学习的阶段,完成了“通识”教育,再借助“预训练+精调”等模式,带来了新的AI研发方式,所以让AI模型可以更统一、更简单的方式下规模化生产。
对于百度而言,文心大模型除了可以推出类ChatGPT产品外,还可以全面接入百度地图、Apollo、小度、爱奇艺等百度系产品,对社会而言,文心大模型在推动自动驾驶、智能交通业务方面,也会发挥关键作用。
比如在通用大模型基础上,建立交通行业大模型,形成智能信控、智慧停车、智慧高速等解决方案。在智能信控方面,通过让红绿灯能“数车”,让车能“读秒”等,可以提升15%-30%的通行效率,从而推动GDP2.4%-4.8%的增长。
换言之,文心大模型是一个可以充分降本增效的工具,可以用于各行各业,而不仅局限于人机对话交流领域,这也是类chatgpt产品能引起社会关注,资本涌入的主要原因。
据2023年数智金融峰会信息,“对于金融行业来说,文心一言将率先在智能检索、投研助手、金融数字人、智能客服、智能创作等场景落地”。其他落地场景或将包括智能客服、智能对话、智能创作、知识管理等内容、信息相关的场景。关于百度文心大模型的具体应用效果,值得市场期待。
© THE END
本文仅作为分享学习使用,不构成任何投资建议。
本文由贝克街探案官原创,未经许可,请勿转载。