深燃(shenrancaijing)原创
作者 | 黎明
编辑 | 魏佳
人工智能的火烧了很多年,2023年有了越烧越旺的迹象。
AI直播、AI绘画、AI作曲,AIGC(人工智能生成内容)的热度一波接一波;聊天机器人ChatGPT掀起的讨论还未停歇,技术加速向大众普及;产业端的应用更是百花齐放,人工智能进入大规模落地阶段。
在1月10日举行的百度Create大会(暨百度AI开发者大会)上,百度CEO李彦宏说,过去一年,无论是技术层面还是商业应用层面,人工智能都有了方向性的改变。
这种改变是在基础软件的推动下实现的。不论是移动互联网时代,还是如今的人工智能时代,蓬勃发展的关键节点都是基础软件实现了技术大飞跃。尤其是作为底层技术的操作系统,直接决定了产业天花板的高度。
然而外界对软件的关注还不够。过去人们热衷于讨论芯片,“缺芯”之痛让国人感同身受,基础软件的战争更多时候则是在水下进行。
李彦宏认为,芯片卡脖子很要紧,但软件卡脖子一样要紧。必须要把软件的根扎下去,才能让创新持续发生,才能让顶层的商业更加繁荣。
过去十年里,百度在人工智能领域投入上千亿资金,在深度学习框架上持续钻研,如今似乎到了开花结果的时候。
而随着后疫情时代社会全面复苏,全力拼经济成为各行各业的共识,如何保持高速增长、穿越经济周期,成为一个更重要的命题。人工智能产业突围的钥匙,就藏在这风起云涌的时代变局里。
熟悉互联网的人,应该对“操作系统”这个词不陌生。PC互联网时代,Windows操作系统让个人电脑得到普及,催生了互联网的繁荣;移动互联网时代,安卓和IOS操作系统让手机成为“智能手机”,开启互联网黄金十年。
作为技术底层的操作系统看不见摸不着,但它就像水电一样存在,承担着基础设施的作用。在操作系统之上,无数个应用软件被开发出来,构建起庞大的生态。
以手机为例,开发者可以推出各种功能的APP,消费者可以购买任意品牌的手机,但无论如何也绕不开安卓和IOS这两大操作系统。因为这是底座,难以被替代。
可惜的是,无论是PC还是移动时代,操作系统的主导权都掌握在国外科技巨头手里。微软、谷歌、苹果,都是美国公司。
华为开发鸿蒙系统,很大程度上就是为了实现基础软件的自主可控。芯片已经被制裁了,软件不能再重走被卡脖子的戏份。但即便强如华为,开发一款真正意义上的国产操作系统也不容易。
在国际局势异常复杂的今天,基础软件的竞争已成为国家战略科技竞争的制高点。在大国博弈中,掌握核心技术的科技巨头,很容易成为谈判桌上的筹码,甚至被作为武器推向战场中央。
科幻小说《三体》就很好地阐释了何为降维打击,在宇宙的黑暗森林中,三体人通过对地球文明的基础科学进行封锁,将人类科技的发展锁死在低级阶段。这种看不见的科技战才是最残酷的。
从移动互联网时代到人工智能时代,操作系统的竞争又发生了哪些变化?
越来越多的观点认为,深度学习框架相当于智能时代的操作系统。大国之间的人工智能竞赛很可能会演化成一场“框架之争”。
在人工智能技术体系中,深度学习框架是底层能力,和芯片一起构成了人工智能的基础设施。它向下接入各类芯片和大型计算机系统,向上承载各种AI业务模型、行业应用,处于贯通上下的腰部位置。
从架构上来看,深度学习框架是整个AI蓝图想象力的原点。用C++编程语言发明者Bjarne Stroustrup的话说,在人工智能时代,“人类文明运行在深度学习框架之上”。
基于深度学习框架,开发者可以直接绕过复杂的神经网络开发,从框架平台的模型库中进行选择,再导入数据进行模型训练,进而实现AI应用部署。这相当于解决了AI开发从0到1的问题,极大缩短了开发周期,降低了开发成本。
对于中国而言,人工智能的应用涉及广泛,安防、城市交通、公共服务等重要领域的安全风险等级高。芯片卡脖子要紧,软件卡脖子一样要紧。
从安全角度,只有把应用放在自己的平台上,才能避免被别人牵着鼻子走。
战争早就打响了。
谷歌在2015年11月推出了机器学习开源工具TensorFlow,Facebook(现更名为Meta)在2017年开源了深度学习框架PyTorch。这是国际主流的两大深度学习框架,这两家公司都是美国公司。
面对那些已经在操作系统领域建立起护城河的巨头们,中国公司拿什么去竞争?我们已经错过了两波浪潮,这一次有把握抓住吗?
有人说,打败安卓的,一定不是另一个安卓。这句话放在人工智能竞赛中非常适用。
微软是PC时代的霸主,拥有专利壁垒和网络效应,苹果转换赛道,用智能手机把微软拉进移动互联网的战场,从而建立了竞争优势。如今跨进人工智能时代,同样存在赛场转换的窗口期。新战场会诞生新的王者,突破深度学习技术,就抓住了人工智能时代突围的钥匙。
深度学习框架已经得到国家战略层面的支持。
早在2017年,国家发改委批复筹建深度学习技术及应用国家工程实验室,由百度牵头,这是国内首个深度学习领域的国家工程实验室。
2021年3月公布的国家十四五规划,针对核心的“新一代人工智能”领域,明确提出要加强“深度学习框架”领域创新攻关。
中国的科技企业很早就开始布局,以避免像PC和移动互联网时代那样输在起跑线。
百度在2016年推出开源的深度学习框架PaddlePaddle,并于2019年正式有了中文名称“飞桨”。2020年,国内开源框架迎来了第一波集中爆发。旷视的天元(MegEngine)、华为的昇思(MindSpore)、清华大学的计图(Jittor),都在这期间诞生。
在这场突围赛中,百度是排头兵和领头羊。
从布局时间来看,百度是继谷歌、Facebook、IBM之后,全球第四家、中国第一家开源深度学习开发框架的科技公司,且日益成为这些国际巨头的有力竞争对手。
IDC数据显示,2019年下半年,飞桨在中国的份额排名第三,位居TensorFlow、PyTorch之后。但是到了2021年,飞桨在深度学习平台综合份额中的排名超越TensorFlow、PyTorch,升至中国第一。
中国信通院与深度学习技术及应用国家工程研究中心联合发布的《深度学习平台发展报告(2022年)》(以下简称《报告》)显示,百度飞桨在中国深度学习市场应用规模第一。
从一开始,百度就将谷歌、Meta这些国际巨头作为竞争对手,飞桨的技术文档是中英文双语面向全球用户,飞桨也是目前唯一一款由中国公司自主研发、冲入世界前三的深度学习框架。
在和国际巨头硬碰硬的竞争中不占劣势,且在中国市场取得领先地位,百度为中国人工智能的突围打了个样,同时也带动了整个人工智能生态的繁荣,普及到更多的开发者和企业。
根据百度透露的数据,飞桨已凝聚535万开发者,服务20万企事业单位,基于飞桨创建了67万个模型,已经构建起一个繁荣的深度学习生态。《报告》还公布了另一个信息:我国已成为全球开发框架生态发展最快的国家。
相比芯片领域的热闹和喧嚣,人工智能深度学习框架的博弈隐秘而深远,这或许是中国互联网在步入下一个十年的路途中,少有的能弯道超车的机会。
李彦宏说,他感觉过去一年人们对“风口”的讨论少了一些,对增长的健康度关注更多了。
这是深度学习框架越来越受到产业界关注的一个重要原因,百度也是因为这一点,坐到了人工智能产业的风口上。
但在过去相当长的时间里,百度是在坐冷板凳。短期看不到商业前景的人工智能,曾被很多人质疑。尤其是深度学习框架,对技术、资金、耐心的要求极高,坚持投入的企业屈指可数。
百度在2013年就开始研发深度学习框架,当时主要为了解决主流开发框架仅支持GPU应用、无法进行大规模数据处理的问题。经过三年探索,百度在2016年开源飞桨深度学习平台。
在科技创新这条路上,先驱者的角色不好当,因为很多时候无迹可寻。后来者可以摸着前人留下的石头过河,但先驱者只能靠自己。按照李彦宏的话:是摸着“反馈”过河。
“很多时候,事物的实际发展路径,和最初的设想是大相径庭的。技术的发展,没有导航地图,只有指南针。在方向大致正确的情况下,基于实践反馈,一步步迭代,才能跑出有价值的创新。”李彦宏说。
用户和客户的反馈,被百度视为驱动创新的重要因素。不论是百度昆仑芯片长期服务于百度搜索,根据反馈倒逼大模型、深度学习框架和芯片的优化,还是定期公布萝卜快跑的订单量,根据反馈来预判自动驾驶的落地速度,都体现了“反馈驱动创新”。
这让百度在人工智能深度学习算法的研发和应用上,走出了一条与众不同的路。
在技术实力、功能体验、生态规模这三个最重要的指标上,百度飞桨构建起了一定的壁垒。
百度非常看重技术投入和创新,一直坚持压强式、马拉松式的研发投入,近十年累计研发投入超过1000亿元。在AI专利申请量方面,百度超过1.3万件,连续四年位列中国第一,深度学习专利申请量更是位列全球第一。
在科技行业,专利是一家公司最重要的护城河。有了专利壁垒,后来的竞争者就很难赶超。
在功能体验上,飞桨让AI开发和使用的门槛不断降低,它对很多算法进行完整封装,开发者只需要导入自己的数据就可以执行运行的命令,简单易上手,“让开发者能够像搭积木一样构建AI应用”。
这方面最直接的案例是大模型的产业化应用。2022年堪称大模型产业化应用元年,百度文心已经累计发布11个行业大模型,这大幅降低了大模型应用门槛,摆脱了传统AI应用碎片化、作坊式开发的方式。
做操作系统的挑战除了技术,更在生态。飞桨从一开始就全面开源,构建开放生态。它把自己的技术释放出来,联合一帮生态伙伴共同打造AI生态,这也是飞桨在中国市场能够快速应用的重要原因。
从当年的冷板凳选手,到如今的主力选手,百度用十年时间开发出了一款适合中国智能时代的“操作系统”。这其中的冷暖,只有深入产业之中才能有所体味。
随着底层技术的成熟,人工智能的应用步入发展快车道。
最典型的一个例证是,AIGC技术在应用方面取得了很好的突破。AI从理解内容,走向了自动生成内容,这包括AIGC用于作画、图文、视频等多类型的内容创作。
百度为中国青年网的短视频平台青蜂侠定制的数字人主播“青小霞”,通过百度AIGC技术,只要几分钟,搭配基础文本,就能产生一条字幕配音齐全的视频,“精通”多国语言,还能24小时不停播。
国家预警信息中心基于百度TTV技术,实现了从AI图文+视频创作能力的落地,将生产一条预警信息视频的时间缩短至90秒,两年内总发布量高达100万篇,触达人次408亿。
AI代替人工生产内容,产生如此颠覆性的效率提升,这在过去是不敢想象的。
百度的人工智能技术在实体经济中的应用效果也相当震撼。
比如智能交通,百度的智能交通方案已经落地全国63个城市,通过对交通网络的智能化改造,可以把通行效率提升15%至30%。李彦宏将之形容为一个“智能调度系统”,他认为2032年之前,靠交通效率的提升,拥堵问题就基本可以解决。
再比如智能检测,百度智能云推出了工业互联网品牌开物,以减少企业数字化建设成本,避免重复造轮子。百度AI对东南相互电子公司检验工人多年沉淀的复核经验进行学习,形成一个与资深人员拥有相同检验质量标准的AI模型,模型被装入到产线,短短几秒钟就能判定成品是否异常。这让工厂的品质良率提升近3%,报废成本一年降低1000多万。
这两个案例只是百度在众多产业应用中的一个缩影。在能源、电力、水务、农业等领域,很多公司通过百度AI实现了效率的显著提升。这些故事发生在2022年,也将在接下来的十年里继续发生。
在2021年的百度Create大会上,李彦宏说过这样一句话:“随着技术应用门槛不断降低,创造者们将迎来属于人工智能的黄金10年”。一年过去了,李彦宏说他依然坚持这个观点。
2022年对于很多行业都不容易,人工智能产业也是在波折中艰难向前。疫情冲击、技术封锁、大国博弈,时代的灰尘落在企业头上,就是一座大山。很多企业被压垮了,但也有一些企业坚持了下来。这些活下来的企业,将有机会享受到人工智能黄金十年的红利。
“发展的方向是明确的,但实现的过程却不会容易,甚至会非常困难非常有挑战。这就是技术发展的特点。技术战略,意味着长周期,而长周期不可能一帆风顺。”李彦宏说。
在这一次百度Create大会上,李彦宏通过百度AI作画平台一格,用“危机和希望”为关键词,由人工智能自动生成了一幅画。
在这个寒冬即将结束,春天尚未到来的特殊时期,对于企业和个人开发者而言,信心比黄金更重要。李彦宏呼吁大家要直面困难,用创新驱动增长。
从技术垄断到艰难突围,从潜心研发到开放开源,从孤注一掷到百花齐放,中国人工智能产业在底层技术的创新,走过漫漫长路,迎接下一个黄金十年。