当前位置:首页|资讯|李彦宏|百度|深度学习

李彦宏和百度,抵达“明天”

作者:21世纪商业评论发布时间:2023-09-25

原标题:李彦宏和百度,抵达“明天”

文丨魏巍

731房间的敲门声响起,杰夫·辛顿(Geoff Hinton)紧张地指挥着两个学生把坐垫、熨衣板和湿毛巾藏起来。

这位日后被称为深度学习巨头、图灵奖得主的65岁男人努力挺直腰板,不想在来人面前透露出任何老态。

让Hinton如此紧张的人,来自一家中国公司。

这是2012年冬天,在发布了一篇长度9页的论文《ImageNet Classification with Deep Convolutional Neural Networks》、验证了深度学习的威力之后,大洋彼岸的李彦宏敏锐地发现了这项研究的价值,旋即安排当时负责百度战略投资的副总裁汤和松与Hinton取得联系,发出橄榄枝,邀请他加盟百度。

这一动作带动了另外两家科技巨头,紧随其后,谷歌和微软也相继发出了邀约。

中美科技公司的竞相邀约变成了一项竞拍,这就是那场日后被人们视为“一场全球新的军备竞赛的开始”竞拍会。

为了争取到Hinton,李彦宏托当时刚刚受邀加入百度的一位AI研究者前往美国,在哈拉斯赌场酒店731房间里,现场参与竞拍。

那几天,这位来自百度的技术专家一次次出入731房间探望Hinton,希望能了解一些拍卖走向,增加胜算。

为期数天的竞价中,从1500万美元的起价至最高4000多万美元,百度始终是出价最高的一家

可惜,出于类似不想高龄远渡重洋等种种原因,Hinton最终决定加入同为美国公司的Google,与百度擦身而过。

那是中国移动互联网迅速崛起的一段时期,APP创业遍地黄金,“千团大战”战火交织,共享单车开遍大地;

但李彦宏却在这次竞拍中坚定了投入深度学习、加快布局AI技术的决心,2013年1月,李彦宏在百度主导成立了全球第一个深度学习研究院,并亲自出任院长。

日后人们回顾来看,才意识到这是全球第一家以深度学习命名的研究院,意识到李彦宏与百度入局AI研究的时间之早,意识到有诸多AI界的风云人物都曾与此有关——比如吴恩达,这位一度接管该研究院的人工智能知名学者,在2023年与李彦宏一起登上了《时代周刊》评选的全球百大AI人物榜单。

在漫长的投身于AI的时间里,曾经有人说,百度有昨天、有明天,唯独没有“今天”。

如今,李彦宏和他的百度,终于抵达了“明天”。

李彦宏与马斯克、Sam Altman等人入选《TIME》全球AI领袖

2023年,在百度文心一言向公众开放三天后,《时代周刊》发布了史上第一份全球百大AI人物榜单,将李彦宏与马斯克、Sam Altman共同评为全球AI领袖

评语中,《时代周刊》称李彦宏为“中国最杰出的未来主义者”。

在“明天”到来之前

有将近十年的时间里,百度在聚光灯外前行。

这是移动互联网发展最快的十年,商业模式层出不穷,商业场上热闹非凡,李彦宏看中的AI领域却屡次遭遇着技术和商业化的瓶颈,甚至陷入沉寂:

Siri在2010年惊艳亮相于苹果商店,引发了人工智能语音助手的爆发,但却在随后数年中停滞不前,问答僵硬如“人工智障”;

AlphaGo在2016年与韩国顶级棋手李世石对决,以4比1取胜,被视为AI技术发展的里程碑事件,可是在演示作用之外,却寻找不到有价值的商业化模式。

时间来到2018年时,情况更为严峻,Uber AI前负责人、AI专家Marcus发表了一篇长达27页的论文质疑深度学习的论文,在业界掀起轩然大波,舆论从质疑深度学习上升到了质疑AI,究竟是人工智能、还是人工智障?AI的方向是不是就错了?

一时间,百度作为中国AI的代表,再次和AI绑定成段子:如果AI有用,百度早就崛起了

“当前,人们对人工智能的态度产生迷茫甚至悲观,这是颠覆性技术在加速普及前的必经阶段。”

悲观情绪最浓烈的时候,李彦宏在世界人工智能大会上演讲,少见地动情,“迷雾终将散去,智能经济和智能社会终将成为现实,而人类终将掌握自己的命运。”

李彦宏在2020年世界人工智能大会上发表演讲

“我对AI的信仰,没有丝毫改变”,那场演讲中,李彦宏给出了自己的坚持。

他应该是中国互联网创始人中最懂技术的那一位,早在90年代在美国留学时就学习过人工智能技术,创立百度前,他曾在美国的一家金融信息公司开发了一个实时新闻检索系统,随后被道琼斯买下,一直沿用。

还在美国的时候,李彦宏就研发出了全球第一个超链搜索引擎,并于1999年获得专利,比谷歌创始人获得超链分析专利的时间提早了两年——日后,谷歌等599项搜索专利都引用了李彦宏的这项专利

透过搜索引擎技术,李彦宏快速识别出人工智能的重要性。

2012年的一天,一位AI出身的高管在办公室里向李彦宏介绍深度学习,深谈过后,李彦宏认识到一个关键问题:深度学习推动下,人工智能很快就会成熟到可以解决搜索所需的所有问题,因为两者的本质,都是让机器真正理解人的意图,并且做出相应回应。

他当即写了一封邮件,鼓励全百度所有的产品经理去了解AI技术的最新趋势。

某种程度上,这也是一种带有“防御性”的前瞻性策略,如果人工智能真的有一天会代替搜索的所有功能,而其领先技术又并未掌握在百度手上,那百度搜索该何去何从?

百度和人工智能是天然契合的,李彦宏判断,如果世界上有一家公司一定要做人工智能的各项技术,那就应该是百度

许多年间,每当百度徘徊在十字路口时,他都会反问自己,什么是让百度能够真正致胜未来的?结论是两个:信仰和决心。

在2012年的那场拍卖中,李彦宏错过了Hinton和他的学生,并未错过“深度学习”,在深度学习研究院成立后,他开始向全球招揽徐伟、张潼等知名人才,许多人都是亲自拜访接待。

徐伟当时在Facebook创建并负责大规模推荐平台,李彦宏向人请教如何吸引他加入百度,对方随口说了一句“你得请他吃饭”,李彦宏就真的飞去当地专门请徐伟吃了一顿饭。

徐伟加入百度后,成为百度异构计算团队的主要负责人,主导研发了后来的百度深度学习框架“飞桨”。

人才的涌入有着显著的吸引力效应。2014年,斯坦福大学人工智能实验室主任、“谷歌大脑”的缔造者吴恩达在加入百度时,百度发了一封内部信宣告这一加盟,吴恩达也回复了一封邮件。

两封信传出当天,六名原本在犹豫的AI科学家回复了百度的邮件,表达了明确的加入意向。

至2017年离开时,吴恩达在百度带领的人工智能研究团队人员已增长至1300名,其中研究院超过300人。

期间,一位名为Dario Amodei的美国博士从斯坦福毕业后,也成为百度硅谷实验室的一员,几年后,他将创立Anthropic,成为OpenAI的最大竞争对手。

飞桨、昆仑芯、智能云等一系列AI底层技术和产品在这些年先后诞生,逐渐形成了百度AI“芯片-框架-模型-应用”的四层架构

文心大模型首次发布于2019年

很多工作仍然是在黑夜中前行,互联网世界从不停止喧嚣,几年前的一波中概股互联网企业市值暴涨中,一些公司甚至用“增长出了几个百度”作为拉踩式的衡量——但也恰恰是在这一年,百度的文心大模型悄然面世。

那时,距离ChatGPT的基础大模型GPT-3发布还有16个月。

聚光灯下

文心大模型背后,是从百度内部成长起来的一批AI人才。

王海峰加入百度的时间是2010年,这位日后升任至百度CTO的哈工大毕业生,在加入百度之前已经成为业界知名的自然语言处理(NLP)专家,但在2009年的百度世界大会上,他被李彦宏提出的一个名词打动了:框计算。

当时对百度“框计算”的报道

“你不必再输入准确的关键词,只需要一句话、一个短语、或者随便什么要求,百度都可以理解,努力给出你想要的结果或者服务”——这就是“框计算”的涵义。

李彦宏在上面讲,王海峰在下面听,他脑子里闪过一点:想把框计算做深,没有NLP的加持是不可能的,NLP我做了十几年,有信心做好。

不久后,王海峰出现在百度的办公室,从此,公司多了一个每天早上七点半抵达的人。

吴华,王海峰的老相识,东芝研发中心时期的同事;吴甜,一位人工智能专业的浙大毕业生……一批对AI抱有高度热情的人们加入了王海峰的团队,他们成立了一支精悍的小组织:百度NLP团队。

打造百度翻译是他们当时的重任。

那时,Google已经推出了谷歌翻译,但早期的机器翻译无法理解语义和上下文相关理解,能将“how old are you ”翻译成“怎么老是你”,令人啼笑皆非。

2014年前后,随着深度学习和神经网络在业界影响扩大,国内外大量AI人才涌入百度,百度的NLP团队看到了神经网络对翻译产品的影响,虽然当时学界还没有完全证明两者强相关,但团队大胆地决定在翻译产品上使用神经网络,加强机器对上下文的理解,从而产生更为流畅的译文。

在克服了算力、模型、应用等多重障碍后,次年,百度率先发布了在线神经网络机器翻译系统,成为全球第一个能支持200多语种的翻译系统,比Google提早了整整一年零3个月,被称为“旗帜性的进步”,并由此获得国家科技进步二等奖。

这也是AI大模型风靡全球后,其“理解、生成、逻辑、记忆”四大核心能力中“理解”能力的雏形。

在搜索、翻译、语音助理等多种产品的持续打磨中,百度内部的一批技术人才纷纷成长成为NLP、语音识别、深度学习等诸多AI领域技术专家,至2023年,信通院调研报告显示,百度以85.5份超越其他企业和各大高校,位居“AI产业创新人才”全国第一。

这无疑推动了文心大模型在2019年率先面世,并保持着快速的迭代速度:

2019年7月,文心大模型升级至2.0;2021年12月,百度推出了基于文心大模型的2600亿参数知识增强大模型;次年5月,11个基于文心的行业大模型发布。

至2023年3月16日,全行业的期待下,李彦宏宣布了文心一言的发布。

“从某种意义上说,我们已经为此准备了多年,我们十几年前就开始投入AI研究,2019年就推出了文心大语言模型,今天的发布是过去多年努力的延续。”舞台上,李彦宏一如既往地温和却坚定。

来源:视觉中国

百度又一次站回了聚光灯下。

文心一言成为全球大厂中第一个诞生的AI大模型产品,5个月后,又成为第一批面向公众开放的、一个可体验、摸得着的AIGC产品,在8月31日面向公众开放的当天,文心一言就回复了网友总计3342万个问题,问鼎各家应用商店榜首。

“此举标志着中国行业领导者的重大突破,是其飞速发展的人工智能行业的里程碑。”彭博社在报道中写道。

多家外媒将文心一言视为中国大模型的领导者,“文心一言引发了最大的兴奋”,《经济学人》在9月3日的报道中写道。

在《时代周刊》紧随其后发布的全球AI百大人物榜单中,李彦宏被评为全球AI领袖,与马斯克、黄仁勋、OpenAI CEO 萨姆·奥特曼等人并列出现。

这背后是李彦宏与百度人的十年夜行。就像有人发现,在这份榜单中,也有着另一些百度的痕迹:

吴恩达和Dario Amodei的名字同时位列其中,印证了这十多年以来的一些往事。

李彦宏曾在2020年的致股东信中写道,我们有决心,有耐心,我们熬得过万丈孤独,藏得下星辰大海

聚光灯下的一时瞩目,是那些关于AI的决心、耐心,是那些不被理解和不被看到的时间里的一份坚持。

2020年回港上市时的李彦宏

有人将李彦宏称为中国的AI教父,他不仅是百度AI的领跑人,也是整个科技界的AI布道师,有统计称,在AI最不受重视的2017至2019年,李彦宏的40次演讲,共计15万字,都涉及了AI;

在连续8年的“两会”中,李彦宏提出了13份AI相关提案;

2020年,百度提出未来5年为社会培养超500万AI人才,至今已与各大高校合作,培养了超300万人才。

一个行业和一家企业的砥砺前行,总是需要这样一位矢志不渝的人。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1