低调如百度,也开始迎来新的收获时刻。
根据百度刚刚发布的财报数据显示截至2022年12月31日的第四季度及全年未经审计的财务报告。2022年,百度实现营收1236.75亿元,归属百度的净利润(非美国通用会计准则)206.8亿元,同比增长10%。第四季度,百度实现营收330.77亿元,归属百度的净利润53.71亿元,同比增长32%。2022财年,百度核心连续四个季度业绩超市场预期。
百度宣布即将在3月上旬发布生成式AI产品“文心一言”内测,这是国内最受关注的生成式AI产品,环顾全球,大公司纷纷进军生成式AI产品,百度再次被行业瞩目。
生成式AI产品的商战硝烟,先从搜索引擎开始。
搜索引擎进入更迭时代
1. 搜索方式被更迭
为什么是搜索引擎?无论你看过多少关于生成式AI产品的各种段子,你无可否认,数十年来由搜索这种形态的互联网商业模式被挑战,过去你在购物网站找商品的本质也是搜索,去知识问答平台寻找答案也是搜索。
但目前所有的搜索引擎,其本质还是格式指令的结果筛选,用户需要不断修正搜索关键词,去获得想要的答案,而这个答案是用户从海量信息中筛选。
而生成式AI产品的颠覆之处,是通过自然语言去告诉系统,按照你的需求,给出适当准确的答案,比如过去你通过搜索引擎无法知道某条路此刻是否拥堵,必须借助电子地图软件,你搜索仅能获取一些带有广告、过时或者是不准确的信息,这是传统搜索引擎的逻辑不同,你只能通过预留的关键词和格式,去触发和寻找结果。
尽管人工智能介入之后,不分搜索结果是千人千面,但相比之下,通过大模型为基础的自然语言理解的生成式AI产品,最核心的一点是能够“理解”指令,并且能够根据指令计算和生产信息。
比如写作者可以通过其写作,程序员可以通过其生产代码,基于大模型的算法和强大的算力,这些功能还在实时的进化,也正是这种能力,已经把搜索引擎的传统定义给颠覆,搜索引擎必然需要迭代,这也是巨头们进军生成式AI产品的原因之一。
2. NLP技术是前戏
人类诞生,一切认知都是经由个体的意识活动,而对于事物产生理解的历程,自从人类演化出语言,人类的文明进步使得认知本身变得更加多元和复杂,复杂到足以形成一个无穷尽的系统,而我们的认知都会被归在语意的斑驳复杂,尤其是博大精深的中文世界。
正是因为语言的存在,所以文明才能延续,也在某个程度成为部分国人“四六级”考试的拦路虎,人类自己本身尚且对于语言的理解还不够,何况让基于服务器的程序代码,通过算法去理解语言,并且产生准确的答案。
这自然归结于NLP(自然语言处理)的能力,在人工智能领域,NLP技术的突破,是生成式AI产品对于人们震撼,这项技术也被誉为“人工智能皇冠上的明珠”,这项技术在很长一段时间内都很难突破。
NLP技术的效果,体现在学习上,对于机器的学习,内容的支撑是必然,在这方面,国内几乎没有其他公司能超越百度:从诞生之日起,用户每次的的搜索,都成为NLP的样本,在语音、图片等识别上,智能不断堆积的数据量,增加技术模型的数量,机器不断学习进化,结果也才会更准确。
把非精准的模糊化语义理解成功,早在2019年3月,百度提出知识增强的语义理解框架ERNIE,在深度学习的基础上融入知识,同时具备持续学习能力,2021年9月,百度发布了PLATO-XL,这是全球首个百亿参数的对话大模型,一举超过 Facebook Blender、谷歌 Meena和微软 DialoGPT,成为全球首个百亿参数中英文对话预训练生成模型,再次刷新了开放域对话效果,打开了对话模型的想象空间。
文心一言面向语言理解、语言生成等 NLP 场景,具备超强语言理解能力以及对话生成、文学创作等能力。站在更宏观的角度,这类生成式AI产品也不过是目前人工智能技术的一个产品应用而已,或者说这是人工智能浪潮的大幕前戏。
3. 人工智能的新基建
类似文心一言式生成式AI产品的出现,更像是一次新的数字化基础设施建设。
首先是算力,从NLP技术初期到深度神经网络技术,千亿级的规模的数据算力已经不是普通公司能够参与的,也正是基于庞大的数据量和强大的算力,才有了如今的生成式AI产品,动辄数百PB、万亿级参数,对于未来的通用型AI,都是极大的考验。
根据IDC发布《2022 中国大模型发展白皮书》指出,百度旗下文心大模型在市场格局中处于第一梯队,产品能力、生态能力、应用能力皆位列前茅。
2022 年 11 月,百度发布了文心大模型的最新升级,包括新增 11 个大模型,大模型总量增至 36 个,构建起业界规模最大的产业大模型体系。
人类进入人工智能时代,IT技术的技术栈发生了根本性的变化。过去基本分为三层:芯片层,操作系统层和应用层,现在可以分为四层:芯片层、框架层、模型层和应用层。
百度在人工智能的布局技术架构是在芯片、框架、模型、应用四层技术栈均有布局,而文心一言处于模型层。
AI的三要素包括算力、算法和数据,百度在阳泉、徐水、定兴三个云计算中心,其中,阳泉智能云数据中心仅一期就可承载16万台服务器,预计整个百度阳泉云计算中心可承载24万台服务器,是亚洲最大的单体智算中心。
无论如何,文心一言揭开了百度人工智能布局的冰山一角,可以窥见百度在人工智能的布局就是中国数字化新基建成果之一。
为什么是百度?
1. 国产化主旋律已经响起
无论出于政策原因,还是信息安全的考量,中国必然需要更适合国人的生成式AI产品,国产化成为趋势。
从搜索引擎行业本身而言,百度毋庸置疑依旧是国内份额最大的搜索引擎平台,从人工智能的布局来看,国内尚未出现可以与其匹敌的搜素引擎或是亿级用户生成式AI产品,毕竟受限于算力、算法和数据的限制。
文心一言会显著帮助百度提升搜索引擎产品,因为NLP自然语言理解的介入,可以预见的是搜索结果的信息整合结果,会出现质变,生成式AI产品会让用户震撼。其次,搜索自身有了创作能力,信息更加多元,个性化体验也更加明显,而本土技术平台,从技术站位和地缘性角度,对于中文的自然语言理解能力毋庸置疑。
2. 热度催生产业商业进化
生成式AI产品本身就不仅是基于问答结果的呈现,而是生态。
首先基于新产品本身,可以看到,文心一言将会成为百度未来商业化新的增长点,比如说付费服务,国内收费会员产品已经成为用户使用习惯,只要提供更好的服务,付费并不是障碍,个性化会员服务会成为一个亮点。
其次,广告本身还会存在,小程序的存在方式或许会变,但更适合未来的新产品,基于生成式AI产品更适合嵌入式的应用场景,这些都会成为百度新的增长点。
还有更重要的一点,文心一言的出现会加速百度通过人工智能技术赋能其他产业,从技术本身,基于百度文心大模型已经产生了多款面向 C 端的单点产品,例如产业级搜索系统“文心百中”。文心百中具有三大特性:简单、强大、高效。文心百中采用纯神经搜ß索架构加数据驱动搜索效果优化策略设计而成,应用简便,仅需三步即可在线完成搜索引擎的构建。
也是基于百度智能云的生态,其他产业会更加简单的产生全新的生态玩法,或许超越目前移动互联网的商业模式,这一点也不用怀疑,这是技术驱动的变革,比如:传统记者可以利用创作能力更快的写作、律师团队可以快速检索和生成法律文件资料……
每个垂类行业都有了自己的想象空间,不夸张形容,围绕人工智能的商业生态,这一轮会形成产业驱动的态势,根据媒体报道,目前已有包括互联网、媒体、金融、汽车、企业软件等行业的300多家企业宣布加入“文心一言”生态。基于百度智能云打造的文心一言能力将在内容、信息相关的场景,如智能客服、智能对话、智能创作、知识管理等率先落地。
多年来,在人工智能的战略投入,百度积累了大量的人才、技术和资源,也变成了现在新的热度下催生的商业展望,可以预见在文心一言正式公布之日起,百度的资本价值会回归,这也是多年积累的回报,这也证明百度将作为中国人工智能市场长期增长的最佳代表,站在浪潮之巅。
毋庸置疑,文心一言的出现,考验的不仅是技术,也是物理算力、财力、数据样本数量、质量等的比拼,其实已经不仅是一个技术平台的问题,而是围绕新的开放平台为基础,使得国内基于AI的应用步入新的阶段,可以断言,围绕文心一言的搜索引擎迭代升级以及基于百度AI的产业、商业化会加速中国AI产业智能化升级,这是AI行业发展的未来关键词,没有之一。