文丨魏巍
731房间的敲门声响起,杰夫·辛顿(Geoff Hinton)紧张地指挥着两个学生把坐垫、熨衣板和湿毛巾藏起来。
这位日后被称为深度学习巨头、图灵奖得主的65岁男人努力挺直腰板,不想在来人面前透露出任何老态。
让Hinton如此紧张的人,来自一家中国公司。
这是2012年冬天,在发布了一篇长度9页的论文《ImageNet Classification with Deep Convolutional Neural Networks》、验证了深度学习的威力之后,大洋彼岸的李彦宏敏锐地发现了这项研究的价值,旋即安排当时负责百度战略投资的副总裁汤和松与Hinton取得联系,发出橄榄枝,邀请他加盟百度。
这一动作带动了另外两家科技巨头,紧随其后,谷歌和微软也相继发出了邀约。
中美科技公司的竞相邀约变成了一项竞拍,这就是那场日后被人们视为“一场全球新的军备竞赛的开始”竞拍会。
为了争取到Hinton,李彦宏托当时刚刚受邀加入百度的一位AI研究者前往美国,在哈拉斯赌场酒店731房间里,现场参与竞拍。
那几天,这位来自百度的技术专家一次次出入731房间探望Hinton,希望能了解一些拍卖走向,增加胜算。
为期数天的竞价中,从1500万美元的起价至最高4000多万美元,百度始终是出价最高的一家。
可惜,出于类似不想高龄远渡重洋等种种原因,Hinton最终决定加入同为美国公司的Google,与百度擦身而过。
那是中国移动互联网迅速崛起的一段时期,APP创业遍地黄金,“千团大战”战火交织,共享单车开遍大地;
但李彦宏却在这次竞拍中坚定了投入深度学习、加快布局AI技术的决心,2013年1月,李彦宏在百度主导成立了全球第一个深度学习研究院,并亲自出任院长。
日后人们回顾来看,才意识到这是全球第一家以深度学习命名的研究院,意识到李彦宏与百度入局AI研究的时间之早,意识到有诸多AI界的风云人物都曾与此有关——比如吴恩达,这位一度接管该研究院的人工智能知名学者,在2023年与李彦宏一起登上了《时代周刊》评选的全球百大AI人物榜单。
在漫长的投身于AI的时间里,曾经有人说,百度有昨天、有明天,唯独没有“今天”。
如今,李彦宏和他的百度,终于抵达了“明天”。
李彦宏与马斯克、Sam Altman等人入选《TIME》全球AI领袖
2023年,在百度文心一言向公众开放三天后,《时代周刊》发布了史上第一份全球百大AI人物榜单,将李彦宏与马斯克、Sam Altman共同评为全球AI领袖。
评语中,《时代周刊》称李彦宏为“中国最杰出的未来主义者”。
在“明天”到来之前
有将近十年的时间里,百度在聚光灯外前行。
这是移动互联网发展最快的十年,商业模式层出不穷,商业场上热闹非凡,李彦宏看中的AI领域却屡次遭遇着技术和商业化的瓶颈,甚至陷入沉寂:
Siri在2010年惊艳亮相于苹果商店,引发了人工智能语音助手的爆发,但却在随后数年中停滞不前,问答僵硬如“人工智障”;
AlphaGo在2016年与韩国顶级棋手李世石对决,以4比1取胜,被视为AI技术发展的里程碑事件,可是在演示作用之外,却寻找不到有价值的商业化模式。
时间来到2018年时,情况更为严峻,Uber AI前负责人、AI专家Marcus发表了一篇长达27页的论文质疑深度学习的论文,在业界掀起轩然大波,舆论从质疑深度学习上升到了质疑AI,究竟是人工智能、还是人工智障?AI的方向是不是就错了?
一时间,百度作为中国AI的代表,再次和AI绑定成段子:如果AI有用,百度早就崛起了。
“当前,人们对人工智能的态度产生迷茫甚至悲观,这是颠覆性技术在加速普及前的必经阶段。”
悲观情绪最浓烈的时候,李彦宏在世界人工智能大会上演讲,少见地动情,“迷雾终将散去,智能经济和智能社会终将成为现实,而人类终将掌握自己的命运。”
李彦宏在2020年世界人工智能大会上发表演讲
“我对AI的信仰,没有丝毫改变”,那场演讲中,李彦宏给出了自己的坚持。
他应该是中国互联网创始人中最懂技术的那一位,早在90年代在美国留学时就学习过人工智能技术,创立百度前,他曾在美国的一家金融信息公司开发了一个实时新闻检索系统,随后被道琼斯买下,一直沿用。
还在美国的时候,李彦宏就研发出了全球第一个超链搜索引擎,并于1999年获得专利,比谷歌创始人获得超链分析专利的时间提早了两年——日后,谷歌等599项搜索专利都引用了李彦宏的这项专利。
透过搜索引擎技术,李彦宏快速识别出人工智能的重要性。
2012年的一天,一位AI出身的高管在办公室里向李彦宏介绍深度学习,深谈过后,李彦宏认识到一个关键问题:深度学习推动下,人工智能很快就会成熟到可以解决搜索所需的所有问题,因为两者的本质,都是让机器真正理解人的意图,并且做出相应回应。
他当即写了一封邮件,鼓励全百度所有的产品经理去了解AI技术的最新趋势。
某种程度上,这也是一种带有“防御性”的前瞻性策略,如果人工智能真的有一天会代替搜索的所有功能,而其领先技术又并未掌握在百度手上,那百度搜索该何去何从?
百度和人工智能是天然契合的,李彦宏判断,如果世界上有一家公司一定要做人工智能的各项技术,那就应该是百度。
许多年间,每当百度徘徊在十字路口时,他都会反问自己,什么是让百度能够真正致胜未来的?结论是两个:信仰和决心。
在2012年的那场拍卖中,李彦宏错过了Hinton和他的学生,并未错过“深度学习”,在深度学习研究院成立后,他开始向全球招揽徐伟、张潼等知名人才,许多人都是亲自拜访接待。
徐伟当时在Facebook创建并负责大规模推荐平台,李彦宏向人请教如何吸引他加入百度,对方随口说了一句“你得请他吃饭”,李彦宏就真的飞去当地专门请徐伟吃了一顿饭。
徐伟加入百度后,成为百度异构计算团队的主要负责人,主导研发了后来的百度深度学习框架“飞桨”。
人才的涌入有着显著的吸引力效应。2014年,斯坦福大学人工智能实验室主任、“谷歌大脑”的缔造者吴恩达在加入百度时,百度发了一封内部信宣告这一加盟,吴恩达也回复了一封邮件。
两封信传出当天,六名原本在犹豫的AI科学家回复了百度的邮件,表达了明确的加入意向。
至2017年离开时,吴恩达在百度带领的人工智能研究团队人员已增长至1300名,其中研究院超过300人。
期间,一位名为Dario Amodei的美国博士从斯坦福毕业后,也成为百度硅谷实验室的一员,几年后,他将创立Anthropic,成为OpenAI的最大竞争对手。
飞桨、昆仑芯、智能云等一系列AI底层技术和产品在这些年先后诞生,逐渐形成了百度AI“芯片-框架-模型-应用”的四层架构。
文心大模型首次发布于2019年
很多工作仍然是在黑夜中前行,互联网世界从不停止喧嚣,几年前的一波中概股互联网企业市值暴涨中,一些公司甚至用“增长出了几个百度”作为拉踩式的衡量——但也恰恰是在这一年,百度的文心大模型悄然面世。
那时,距离ChatGPT的基础大模型GPT-3发布还有16个月。
聚光灯下
文心大模型背后,是从百度内部成长起来的一批AI人才。
王海峰加入百度的时间是2010年,这位日后升任至百度CTO的哈工大毕业生,在加入百度之前已经成为业界知名的自然语言处理(NLP)专家,但在2009年的百度世界大会上,他被李彦宏提出的一个名词打动了:框计算。
当时对百度“框计算”的报道
“你不必再输入准确的关键词,只需要一句话、一个短语、或者随便什么要求,百度都可以理解,努力给出你想要的结果或者服务”——这就是“框计算”的涵义。
李彦宏在上面讲,王海峰在下面听,他脑子里闪过一点:想把框计算做深,没有NLP的加持是不可能的,NLP我做了十几年,有信心做好。
不久后,王海峰出现在百度的办公室,从此,公司多了一个每天早上七点半抵达的人。
吴华,王海峰的老相识,东芝研发中心时期的同事;吴甜,一位人工智能专业的浙大毕业生……一批对AI抱有高度热情的人们加入了王海峰的团队,他们成立了一支精悍的小组织:百度NLP团队。
打造百度翻译是他们当时的重任。
那时,Google已经推出了谷歌翻译,但早期的机器翻译无法理解语义和上下文相关理解,能将“how old are you ”翻译成“怎么老是你”,令人啼笑皆非。
2014年前后,随着深度学习和神经网络在业界影响扩大,国内外大量AI人才涌入百度,百度的NLP团队看到了神经网络对翻译产品的影响,虽然当时学界还没有完全证明两者强相关,但团队大胆地决定在翻译产品上使用神经网络,加强机器对上下文的理解,从而产生更为流畅的译文。
在克服了算力、模型、应用等多重障碍后,次年,百度率先发布了在线神经网络机器翻译系统,成为全球第一个能支持200多语种的翻译系统,比Google提早了整整一年零3个月,被称为“旗帜性的进步”,并由此获得国家科技进步二等奖。
这也是AI大模型风靡全球后,其“理解、生成、逻辑、记忆”四大核心能力中“理解”能力的雏形。
在搜索、翻译、语音助理等多种产品的持续打磨中,百度内部的一批技术人才纷纷成长成为NLP、语音识别、深度学习等诸多AI领域技术专家,至2023年,信通院调研报告显示,百度以85.5份超越其他企业和各大高校,位居“AI产业创新人才”全国第一。
这无疑推动了文心大模型在2019年率先面世,并保持着快速的迭代速度:
2019年7月,文心大模型升级至2.0;2021年12月,百度推出了基于文心大模型的2600亿参数知识增强大模型;次年5月,11个基于文心的行业大模型发布。
至2023年3月16日,全行业的期待下,李彦宏宣布了文心一言的发布。
“从某种意义上说,我们已经为此准备了多年,我们十几年前就开始投入AI研究,2019年就推出了文心大语言模型,今天的发布是过去多年努力的延续。”舞台上,李彦宏一如既往地温和却坚定。
来源:视觉中国
百度又一次站回了聚光灯下。
文心一言成为全球大厂中第一个诞生的AI大模型产品,5个月后,又成为第一批面向公众开放的、一个可体验、摸得着的AIGC产品,在8月31日面向公众开放的当天,文心一言就回复了网友总计3342万个问题,问鼎各家应用商店榜首。
“此举标志着中国行业领导者的重大突破,是其飞速发展的人工智能行业的里程碑。”彭博社在报道中写道。
多家外媒将文心一言视为中国大模型的领导者,“文心一言引发了最大的兴奋”,《经济学人》在9月3日的报道中写道。
在《时代周刊》紧随其后发布的全球AI百大人物榜单中,李彦宏被评为全球AI领袖,与马斯克、黄仁勋、OpenAI CEO 萨姆·奥特曼等人并列出现。
这背后是李彦宏与百度人的十年夜行。就像有人发现,在这份榜单中,也有着另一些百度的痕迹:
吴恩达和Dario Amodei的名字同时位列其中,印证了这十多年以来的一些往事。
李彦宏曾在2020年的致股东信中写道,我们有决心,有耐心,我们熬得过万丈孤独,藏得下星辰大海。
聚光灯下的一时瞩目,是那些关于AI的决心、耐心,是那些不被理解和不被看到的时间里的一份坚持。
2020年回港上市时的李彦宏
有人将李彦宏称为中国的AI教父,他不仅是百度AI的领跑人,也是整个科技界的AI布道师,有统计称,在AI最不受重视的2017至2019年,李彦宏的40次演讲,共计15万字,都涉及了AI;
在连续8年的“两会”中,李彦宏提出了13份AI相关提案;
2020年,百度提出未来5年为社会培养超500万AI人才,至今已与各大高校合作,培养了超300万人才。
一个行业和一家企业的砥砺前行,总是需要这样一位矢志不渝的人。