编辑 | 虞尔湖
出品 | 潮起网「于见专栏」
自2022年底ChatGPT带火了AI大模型热潮后,“一窝蜂”现象也在这个新兴的赛道重演。不过,狂热之下,总需要有人保持冷静。
近日,李彦宏在深圳西丽湖论坛上的一句话,可谓振聋发聩:“AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。”对此,李彦宏表达了他个人的担忧。
李彦宏分享的一组行业数据表明,2023年6月份国内大模型就已多达79个,而截至10月份,国内已经发布238个大模型。这也意味着,短短4个月的时间,我国已经进入“百模大战”的混战局面。那么,这到底是好事还是坏事?
在这次论坛上,李彦宏用一系列数据与实例,表达了百度的“人间清醒”,并帮人们梳理出了最终的结论,获得了很多业内人士的高度认同。各种媒体更是借题发挥,似乎瞬间找到了灵感。
AI大模型是“基础设施”,AI原生应用才是“上层建筑”
对于此前业界十分模糊的AI大模型发展的未来走势问题,李彦宏首先道出了结论:AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。对此,李彦宏用操作系统进行对比,并深入浅出的分析了未来的AI大模型生态,应该是什么样子。
李彦宏表示:如今的大模型就如同昔日的PC端、手机端操作系统,最终的格局必然是少数实力玩家取胜。而大多数的机会,在于AI原生应用的研发。
图源:网络-2023西丽湖论坛开幕式现场
众所周知,在操作系统方面,PC电脑时代,Windows操作系统一家独大,而智能手机时代,却是安卓、IoS将操作系统双雄并立的格局。
那么,为何市场如此巨大的操作系统,最终只能呈现出这样的寡头效应?原因很简单,这并不是因为操作系统的研发门槛有多高,而是与之匹配的电脑、手机、智能硬件等设备、应用软件生态是否健全,才是一款操作系统能否能够成为主流的关键因子。
事实也证明,这个赛道并非人迹罕至,但是最终能形成安卓、IoS这样庞大的生态、足够成功的操作系统,却寥寥无几。
例如,此前应用在诺基亚手机上的塞班系统,以及目前华为自主研发的鸿蒙OS,都终究没有太大的市场份额。
而即使很多智能手机厂商也研发了自己品牌的操作系统,多数也是基于安卓操作系统的内核、套壳质疑从未停息。由此也足以印证,成功运营一款操作系统,并整合行业生态,成功率极低。
对比来看AI大模型,或许同样如此。正如李彦宏直言:“大模型时代其实也是类似,大模型本身是一个基础底座,类似操作系统,那么最终开发者要依赖为数不多的大模型来开发出各种各样的原生应用。”
毫无疑问,这将给AI开发者带来前所未有的机会。对此,李彦宏还以移动互联网时代出现的滴滴、微信、抖音等超级国民APP为例,和大家一起展望了这个赛道的想象空间。李彦宏的预期是,AI原生应用的数量“缺口”至少是100万。
据了解,目前市面上的AI大模型,分为通用的基础大模型与行业专用的AI大模型。对此,李彦宏再次提醒,不断地重复开发基础大模型无异于“重复造轮子”,是对社会资源的极大浪费。
李彦宏以国内大模型的实际调用量为例,佐证了这个观点。据称,国内有200多个大模型,上了各类榜单、排名,但其实调用量是很小,而文心大模型一家的调用量,可能比这200多家大模型的调用量加起来还要多。这也意味着,很多大模型产品被官方宣传得“无所不能”,却实际没有用武之地。
「于见专栏」认为,这无异于盖房子只打了地基,却没有“添砖加瓦”,最终的结果必然也是如“形同虚设”或者如同“空中楼阁”,并不切合实际。
“卷”专业大模型南辕北辙,高效应用才能释放价值
AI大模型热潮中,不少业内人士提出了大模型应该垂直化、专业化。对此,李彦宏也表达了不一样的观点。
李彦宏表示,他看到的现象是,很多企业甚至很多城市还在囤芯片,建智算中心,想从头训练自己的专用大模型。但是由于没有智能涌现能力,这些专用大模型的价值非常有限。
何谓“智能涌现”,李彦宏的理解是,大模型需要有触类旁通的能力,也就是没有教过的东西,大模型也会。因此,大模型的产业化模式,应该是把基础模型的通用能力和行业领域的专有知识相结合。从而释放大模型为产业效率提升赋能的价值。
而且,大模型套小模型,专用的小模型反应快、成本低,在更智能大模型赋能之下,企业将AI大模型为自己所用的可能性也变得更大。
以百度为例,百度就在将其基础大模型,逐渐应用到百度的各种产品方面,包括智能搜索、百度地图、百度文库、小度音箱等。百度的每款产品,都相当于是一个专业领域,而一旦将基础大模型的功能融入其中,便可以起到将AI原生应用对产品本身业务的促进与提升作用。
李彦宏以百度文库为例,说明AI原生化重构后,百度文库能在1分钟内生成一个二十几页的PPT,包括图表生成、格式美化等,而且几乎是零成本。这不仅实现了从内容工具到生产力工具的转变,而且也提高了文库的付费率。这就是AI对业务关键指标的促进作用。
值得一提的是,百度基于文心大模型的技术迭代,速度非常快,也为一些专业大模型高效接入、实现对业务的增长拉动带来了想象力。但是,这都是基于百度移动生态沉淀的业务数据。
例如,百度自3月中旬率先发布了基于文心大模型3.0的文心一言产品后,便以周为单位不断迭代,目前已更新至文心4.0,这也是迄今为止最强大的文心大模型,具有理解、生成、逻辑和记忆四大核心能力。而在这些功能的加持下,百度大模型为传统产业赋能,也可谓水到渠成。
AI大模型落地的必要条件
在本次论坛中,李彦宏的演讲主题是两个“冷思考”,三个“热驱动”。两个冷思考,一个是可以将AI大模型类比为上个时代的“操作系统”,另一个是各个AI大模型厂商或许“卷”错了方向。此外,李彦宏还分享了AI大模型落地应用的三大“驱动力”。
其一,强大的基础模型,必然会驱动AI原生应用大爆发,这既是趋势也是现实。目前国内知名的基础大模型很多,但是超级AI原生应用却寥寥无几,也充分说明AI原生应用尚且处于市场空白地带。
李彦宏也表示:“全球来看,AI原生应用正在成为主要趋势。微软没有自己的基础大模型,但是通过与OpenAI合作,却有最成功的AI原生应用,大家知道就是Office365的Copilot,收费30美元/月”。
这也意味着,微软已经通过AI原生应用实现了商业化,但是却不一定需要自主研发大模型。微软这样的巨头企业尚且如此,更遑论一些初创的AI企业。
其二是拥抱AI时代,落地AI大模型应用,需要一把手亲自“下场”,扛起公司内部变革的大旗。事实证明,从古至今,任何时代变革,都会遭遇重重阻力,甚至一些激进的改革者还会遭到保守派的迫害与打击。
因此,李彦宏认为,AI大模型的来临,与昔日的多次工业革命可以相提并论,需要有看得见未来的“领袖人物”,才能有这种驱动力。而在一个企业内部,公司的CEO、一把手无疑是“灵魂人物”,只有此类管理者躬身入局,才能让完美的大模型构想顺利落地。
李彦宏认为“只有CEO才会关心新技术对自己业务的关键指标是不是产生了正面作用。”而在很多企业,十分现实情况却是,企业对问题的本质理解不深,CEO把任务交给IT负责人,IT负责人和工程师却容易被媒体的各种夸张式的舆论、嘈杂的观点所迷惑,从而陷入了“南辕北辙”的尴尬境地。与此同时,最终执行的结果,可能也与公司一把手想要的效果背道而驰。
其三是AI原生应用生态,将会带来国内经济的高速增长。例如,李彦宏以新能源车举例称,中国新能源车在全球的市场份额达到65%。这主要是因为国家政策的扶持拉动了应用端,拉动了市场的需求。而AI产业也是需求驱动,同样如此,需要回归到行业、产业,让其发挥应用价值。
实际上,百度已经在“躬亲示范”,将AI大模型开放给制造、能源、电力、化工、交通等实体产业,也包括教育、电商、短视频、游戏等多个行业进行应用。据李彦宏透露,据李彦宏介绍,在百度智能云千帆大模型平台上,目前有超过17000家企业在这里开发产业模型和解决方案。
而且,早在百度从做AI的第一天,就非常重视生态的建设,目前已经拥有了800万AI开发者。而据百度CTO王海峰在 2023 年世界互联网大会乌镇峰会上披露,文心一言用户规模现已达到 7000 万,场景 4300 个,应用2400余个。
由此可见,只有AI大模型具备了这些落地应用的条件,才能形成一个如同移动互联网应用市场一样的繁荣生态,AI大模型也才大有可为。
结语
业内的共识是,百度是AI人工智能技术的先行者,更是领导者。其正式入局AI赛道,甚至可以追溯至2010年。在这十余年时间内,百度先成立自然语言处理NLP部门,又相继成立了深度学习研究院(IDL)、大数据实验室BDL、硅谷人工智能实验室SVAIL等。为此,百度也付出了数百亿的研发费用,而且还在不断加码。
很显然,百度布局AI,一直是一个“长期主义者”应有的姿态。可以预见,百度在AI赛道的沉淀与底蕴,也将在经历“百模大战”后,为AI原生应用生态走向繁荣的时代来临,打下坚实的根基,并将因此进入收获期,未来将会大有可为。