近期,随着ChatGPT爆火出圈,百度的语言大模型“文心一言”也未至先火,引发了全社会的广泛关注。
目前“文心一言”还在内测,要到三月份才能面向公众开放,但有关“文心一言”的资讯却屡次登上热搜。包括新闻、金融、互联网、制造业等数百家行业头部企业机构纷纷宣布加入百度“文心一言”生态。中国工程院院士邬贺铨更是直接表达了对“文心一言”的肯定与期望:“基于百度对中国文化的感悟和对中国市场的理解,相信能够做出不逊于国外公司的AI(人工智能)应用。”
2月22日,百度(NASDAQ:BIDU,HKEX: 9888)发布了2022年四季度及全年财报。财报显示,2022年,百度实现营收1236.75亿元,归属百度的净利润(非美国通用会计准则)206.8亿元,同比增长10%。
而在财报发布前,多家机构对百度2022年业绩都给出稳中向好的判断,并认为“文心一言”将给百度带来新增长空间。其中海外机构Seeking Alpha分析师表示,百度当前被低估了40%:“自2016年战略聚焦人工智能以来,百度一直走在中国人工智能技术发展的前沿。人工智能技术将有利于百度的智能云和搜索业务,同时让第三方应用程序受益。对百度的目标价约为209美元,较当前水平上涨 40%。”
“2022年是充满挑战的一年,百度利用这段时间为迎接更好的时代做好了准备。对于2023年,百度核心收入恢复加速增长的道路已经明确,我们将充分把握中国经济复苏带来的机会。”百度创始人、董事长兼首席执行官李彦宏表示,“凭借在AI领域的长期投入,百度将抓住即将到来的AI拐点,为我们的整个业务组合——从移动生态到智能云、自动驾驶、智能硬件等——开拓全新的机遇。”
百度已在NLP领域深耕十余年
“文心一言”之所以能够博得领军企业、业界专家甚至投资机构的青睐,离不开百度对自然语言处理(NLP)、大语言模型的布局和探索。
以搜索引擎起家的百度,或是国内最早接触NLP的互联网企业,因为NLP技术本身就是搜索技术的重要组成部分。用户从“百度一下”得到的搜索反馈,都包含着NLP技术对搜索的理解与优化,NLP伴随着百度快速发展,也在同步甚至更快地发展壮大。
2010年初,百度对NLP的工作进行了重新梳理与规划,百度自然语言处理部正式成立,并不断在语音、图片等技术上布局,敲定了在知识图谱技术上长期投入的战略。
2021年4月,百度创始人、董事长兼CEO李彦宏在接受媒体采访时预判道:“未来,自然语言理解会成为主角,当机器可以真正理解人们在说什么的时候,一大批应用就会应运而生,而且会比现在的应用更加流行。”
同年9月,百度发布了PLATO-XL,这是全球首个百亿参数的对话大模型,也是全球首个百亿参数中英文对话预训练生成模型,再次刷新了开放域对话效果,打开了对话模型的想象空间。
攀登技术的高峰,需要资本加持。刚刚发布的2022年财报显示,百度去年的研发投入达到了214.16亿元人民币,占百度核心收入比例达22.4%。回顾过去10年,百度的研发投入超过了1400亿元,并且几乎每一年的同比增长都超过100%。
“文心一言”在中国乃至全球范围均具有综合优势
数以千亿计的投入,奠定了百度在NLP开发的基础优势,“AI的三要素包括算力、算法和数据,我们认为百度在这三项上拥有领先优势。百度在芯片层、框架层、模型层和应用层进行全方位布局。”中金互联网行业首席分析师白洋称,百度同时具备人工智能需要的算力、算法和数据,开发“文心一言”在中国乃至全球范围均具有综合优势。
在算法方面,百度的文心大模型和Open AI的GPT模型类似,在2019年就已经推出,并且已经迭代了多代。从单一的自然语言理解延伸到多模态,包括视觉、文档、文图、语音等多模态多功能,因此“文心一言”所基于的ERNIE系列模型也已经具备较强的泛化能力和性能。
在算力方面, 百度自研AI芯片“昆仑”已在多场景实际部署几万片,在搜索业务中也已形成较强工程化实践,因此,“文心一言”底层算力有所保证。此外,百度也拥有多个云计算可用区、庞大的超算集群,奠定大模型训练的基础设施。目前百度拥有阳泉、徐水、定兴三个云计算中心,其中,阳泉智能云数据中心仅一期就可承载16万台服务器,预计整个百度阳泉云计算中心可承载24万台服务器,能为语音大模型应用提供高并发、高弹性、高精度等不同计算需求。
数据层面,ChatGPT模型训练使用主要来自互联网的文本数据库,包括从网络文本、维基百科、文章中获得高达 570GB的数据,百度的搜索业务在真实数据和用户需求理解方面的积累有较强的先发优势,这些大规模结构化非结构化数据有望支撑ERNIE bot的充分预训练。
“文心一言”作为本土化的大模型,相比于国外模型在中文领域也更有优势。当前已有很多头部企业宣布加入“文心一言”生态圈,对此,北京社科院研究员王鹏在接受媒体采访时表示,对百度来说,与众多上市公司合作能够有更多的数据积累进行训练,另外,可以有更多的场景,进行更多垂直化、专业化的开发。同时还能为未来产品商业化运作提供更多经验。
对于这些接入的行业和企业来说,王鹏认为,他们本身对于新技术,以及信息的精准性、交互性有非常强的需求,且都是高频领域,所以双方的合作可以说是强强联合。未来推广之后,对于传统行业提质降本增效都有影响,会有更多行业从中受益。
NLP将变革云市场游戏规则,选云主要看AI能力
不久前,微软已宣布将OpenAI整合进微软云服务中,接入微软旗下的搜索引擎必应(Bing),还将整合OpenAI的技术以改进Office应用。随后,百度也表示会将“文心一言”通过百度智能云提供给企业和机构客户。
AI原生时代正在加速到来,所有用户、企业都被席卷其中。其对云计算的需求,也将更多体现于对智能化的需求,AI大模型将成为云服务中不可或缺的一部分。早期就选择在智能云方向深耕的百度,先一步拿下了通向未来的船票。
去年底,百度提出了“AI大底座”,旨在标准化地输出智能化的底层能力,把芯片、大模型、深度学习框架等高门槛的技术,变成像水电一样供客户按需取用。
NLP与云业务密不可分,也必将变革云市场的游戏规则。百度在NLP领域占据的优势也会帮助百度智能云赢下更多的市场空间。
Gartner杰出分析师、研究员Rajesh Kandaswamy分析称:“我认为AI从根本上变革了计算,可能比云计算的威力更大。”摩根士丹利认为,百度推出“文心一言”与公司的云业务战略方针步伐相同,可达到云业务中长期增长,并领跑行业。
在发给百度全员的财报信中,李彦宏表示:“人类进入人工智能时代,IT技术的技术栈发生了根本性的变化。过去基本分为三层:芯片层,操作系统层和应用层。现在可以分为四层:芯片层、框架层、模型层和应用层。”“‘文心一言’的能力将通过百度智能云率先在内容和信息相关的行业和场景落地。”
百度集团执行副总裁、百度智能云事业群总裁沈抖表示,“文心一言”是基于百度智能云技术打造出来的大模型,它将根本性地改变云市场的游戏规则,云服务将从数字时代跃迁到智能时代。
“文心一言”赋能,或将开启百度发展新纪元
“文心一言”加速落地,或将成为人工智能发展史上的里程碑与分水岭。
“文心一言”背后的大型语言模型是一项面向未来的先进生产力,让世界看到人工智能技术进化、迭代远高于人类、生物体的速度。可以预见,拥有强大学习和分析能力的Al在很多领域会迅速超过人。而加入基于人类反馈的强化学习训练而成的“文心一言”,也正带来弱人工智能向通用智能的阶跃,或许,实现跨领域的通用人工智能已为期不远。
目前,“文心一言”最主要的应用领域是搜索。搜索会通过嵌入“文心一言”进行技术升级,实现搜索代际变革。“百度一下”将呈现更好的搜索和答案,全新的交互和聊天体现,以及独特的生成内容,吸引更多的用户,由此创造出下一代互联网新的流量入口,并显著扩大搜索的服务场景和市场规模。同时它也将帮助平台上的广告商、内容创作者和商家。
此外,“文心一言”将通过百度智能云提供服务,会吸引大量企业和机构客户使用百度智能云提供的API和基础设施,搭建AI模型、开发应用,并显著提高生产力,为产业带来AI普惠。云服务从数字时代跃迁到智能时代,智能化对各行各业效率的提升将显著显现。
基于“文心一言”带来的变革,有分析称,当下应重新评估和认识(re-read)百度。近期,机构投资者看好百度,包括摩根大通、瑞银集团、美银证券等券商评级均为买入,并认为百度新财年或将实现新飞跃。
摩根士丹利预计百度全年将继续保持高于行业的增长,亏损大幅收窄。老虎国际则对百度长期投资论点(云和人工智能推动收入加速)保持不变,认为市场正围绕复苏的方向进行交易,这应该会持续到3月初。麦格理则预计,百度今年广告及云服务收入增长将会有所回升,受惠于有效的成本控制措施,整体利润率提高,而“文心一言”等人工智能(AI)聊天机器人或将成为可见的上行惊喜机会。