当前位置:首页|资讯|百度|人工智能|ChatGPT

百度在大语言模型中找到了新趋势

作者:长安街知事发布时间:2023-02-23

近日,北京市经济和信息化局发布的《2022年北京人工智能产业发展白皮书》提出,北京市将支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。加强人工智能算力基础设施布局。加速人工智能基础数据供给。

人工智能原生时代正在加速到来,所有用户、企业都身处其中。早期就选择在人工智能领域深耕的百度,先一步拿下了通向未来的船票。

3月,百度计划推出新一代大语言模型——“文心一言”。这是百度基于文心大模型技术推出的生成式对话产品,也是继“文心一格”之后又一个生成式人工智能产品。       

在国内科技企业竞相布局生成式大语言模型的当下,为什么首先出现的是“文心一言”?“文心一言”的出现将为国内人工智能行业带来怎样的风潮?

深耕的百度扛起研发大旗

类ChatGPT的语言大模型是过往人工智能技术的“集大成者”,但是事实上它的迭代和研发存在一定困难。语言大模型的训练和调整需要大量的算力堆砌,而这需要大量的资金、硬件和时间投入。另外,语言大模型训练需要让机器对文字产生理解,但是中文语言丰富且复杂,因此针对中文和中国市场研发语言大模型的难度较高。

这些难题意味着开发成本高企,而很多企业无法承担。所幸,有一些企业可以省去这些顾虑,例如百度。为什么百度有能力推出“文心一言”?

从投入上看,百度营收更趋多元化,经营情况持续向好。年报数据显示,百度实现营收1236.75亿元,归属百度的净利润206.8亿元,同比增长10%。这让百度有足够的资金和底气进行研发。

从技术上看,进入人工智能时代后,IT技术的技术栈发生了根本性的变化。过去的技术栈基本分为三层:芯片层,操作系统层和应用层。而现在可以分为四层:芯片层、框架层、模型层和应用层。百度针对这四层都做了全栈布局,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,各个层面都有关键自研技术,这也是百度在国内独一无二的优势。

此外,早在2019年,百度就推出了文心大模型。文心大模型与Open AI的GPT模型类似,几年来已经迭代了多次,已经从单一的自然语言理解延伸到多模态多功能,如视觉、文档、文图、语音等。因此“文心一言”所基于的文心系列模型也已经具备较强泛化能力和性能,具备智能创作等各类自然语言理解和生成任务,且公开数据集上小样本学习、理解和生成任务效果皆好于业界很多模型。目前,文心系列大模型已经在行业内普遍应用,而支撑该模型的框架——百度飞桨也同样走在行业的领先位置。

同时,百度拥有多个云计算可用区、庞大的超算集群,奠定了大模型训练的基础设施。百度智能云为文心大模型应用提供了高并发、高弹性、高精度等不同计算需求。另外,百度自研AI芯片“昆仑”已在多场景实际部署上万片,在百度的搜索业务中也已形成较强工程化实践,为“文心一言”的底层算力提供了保障。

值得一提的是,百度的搜索业务在真实数据和用户需求理解方面的积累了较强的先发优势,这些大规模结构化、非结构化数据支撑着“文心一言”的充分预训练。以此为基础,随着“文心一言”向公众开放,真实的用户调用和模型迭代之间的飞轮将很快建立,模型也将越来越聪明。

还应该看到的是,百度在自然语言处理领域同样领先于全国。早在百度诞生之时、从百度处理用户的第一次搜索开始,自然语言处理技术就成为搜索技术的重要组成部分,并伴随着百度的快速发展,同步甚至更快地发展壮大。2021年9月,百度发布了全球首个百亿参数的对话大模型PLATO-XL,成为全球首个百亿参数中英文对话预训练生成模型,打开了对话模型的想象空间。同时,百度的文心大模型本就是本土化的人工智能模型,具备对中文、甚至中国文化的更深理解。这都为百度研发“文心一言”奠定了基础。

有了这些条件的沉淀,百度才能成为在行业内率先推出生成式对话产品的企业,而百度作为中国人工智能市场长期增长的优秀代表,正站在浪潮之巅。

文心一言或将引领业务变革

关于ChatGPT的价值,百度创始人、董事长兼首席执行官李彦宏一直抱有一种看法:“ChatGPT是AI技术发展到一定阶段后的新机会。怎么把这么酷的技术,变成人人需要的产品,让每天有几亿人从中受益?怎么赋能千行百业,让他们的生产效率大幅度地提升?这一步才是最难的,最能够产生影响力的。”

如何让技术实现落地应用,并赋能行业的发展,是新技术出现后行业必然考量的问题。对于百度的“文心一言”来说,搜索行业的代际变革和云服务行业的跃迁将会是它应用实践的价值体现。

对于“文心一言”来说,对话内容生成真正的价值在于信息交互模式的改变,而最主要的应用在于搜索。而搜索一直是百度的强项。

财报数据显示,第四季度百度移动端搜索查询次数和信息流分发量继续实现同比两位数的增长。12 月,百度App月活跃用户达到6.48亿,同比增长4%。百度搜索功能接入“文心一言”后,强强联合,将有望迎来再一次增长。

对于百度来说,生成式人工智能和搜索引擎互为补充,“文心一言”接入搜索功能后,人们获取信息的方式将从主动搜索信息,变为人工智能帮助人们搜索信息,并将整理好的信息呈现出来。百度将通过提供更好的搜索和答案、全新的交互和聊天体现以及独特的生成内容,吸引更多的用户,由此创造出下一代互联网新的流量入口,并显著扩大搜索的服务场景和市场规模。此外,搜索底层技术和AI底层技术彼此相通。搜索功能将利用“文心一言”的技术完善升级,形成搜索代际变革。

与此同时,在百度集团执行副总裁、百度智能云事业群总裁沈抖看来,“文心一言”的能力将通过百度智能云率先在内容和信息相关的行业和场景落地。

有分析师认为,人工智能从根本上变革了计算,可能比云计算的威力更大。类似的观点也同样适用于百度。2022年底,百度智能云发布国内首个全栈自研的AI基础设施“AI大底座”,即百度作为云计算厂商将标准化地输出智能化的底层能力,把芯片、大模型、深度学习框架等高门槛的技术,变成像水电一样供客户按需取用。

百度对智能云的投入也得到了回报。财报数据显示,第四季度,百度智能云利用AI技术,为行业提供标准化的解决方案,提高了利润率。2022年,凭借云智一体的优势,百度智能云连续四年稳居AI云服务市场第一。

沈抖表示,“文心一言”是基于百度智能云技术打造出来的大模型,它将根本性地改变云市场的游戏规则。以前企业选择云厂商更多是看算力、存储等基础云服务,以后企业对云的需求会更加聚焦智能服务,更多关注框架、模型,以及模型-框架-芯片-应用这四层架构之间的协同。借着“文心一言”的能力,云服务将从数字时代跃迁到智能时代,而智能化对各行各业效率的提升也将显著显现。

百度还计划将“文心一言”与更多主流业务整合。李彦宏在内部信中指出,文心一言大模型搭载到Apollo智舱系列产品,会让智能汽车具备领先一代的人车交互体验。文心一言与小度进行集成,将显著提升小度与用户进行多轮对话的体验,更加聪明和善解人意。而这些,都将成为“文心一言”为行业增长提供的参考样本。

“我们已经及时地为这一全新的大趋势做好了业务准备。”李彦宏称,“因此,我们将从新的人工智能拐点中受益。”


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1