智东西(公众号:zhidxcom)
作者 | 李水青
编辑 | 漠影
生成式AI(AIGC)正引爆全球,各行各业的CEO和开发者们都在寻找机会,搭上这趟数智化“快班车”,从而实现业务转型、业绩增长。
在国内,接入百度对话机器人“文心一言”无疑成为企业进入AIGC赛道“掘金”的一张入场券。根据官方数据,已有超400家企业宣布接入文心一言,覆盖消费、工业、旅游、传媒等各个领域。
无论是让文心一言做搜索引擎的“大脑”,还是基于其开发智能媒体小编、智能家居助手、电商金牌客服等应用……我们看到,AI不仅在口口相传中名气大涨,也在这一过程中变得更加规模化、平民化、普惠化。
百度创始人兼董事长李彦宏在近日的内部信中说:“AI技术已经发展到一个临界点,各行各业都不可避免地被改变,中国AI市场即将迎来爆发性的需求增长。”
在生成式AI爆发的前夕,企业接入文心一言这样的应用,无疑意味着其搭上了通往数智化高地的“快班车”。但这显然只是“长征”的第一步。如何让AI技术真正跨越工程化鸿沟,飞跃AI落地的“最后一公里”?这是各行各业的CEO和开发人员眼下关注的问题,因为过去几年AI工程化确实经历了不少挫折。
近日,通过对话百度AI中台的三位资深专家,智东西对这一问题进行了深入探讨。百度AI中台,简单说是百度智能云旗下的AI开发PaaS(平台即服务)平台,后续将推动文心一言大规模产业落地,面向企业提供一系列AI开发和运维工具。
一、400+企业接入文心一言,有多少能抵达“最后一公里”?
根据官方消息,百度文心一言将在3月16日正式推出。届时,百度多项主流业务将接入文心一言,包括百度搜索,以及基于百度智能云的智能语音助手小度、智能驾驶阿波罗(Apollo)等;同时,目前已有超400家企业宣布加入文心一言生态圈,享用这一服务。
从AI产业落地的流程来看,接入文心一言或许只是一个开始。
要实现技术到产品的“最后一公里”飞跃并不容易,AI开发工程化尤为重要。如果把AI模型比成一个汽车发动机,AI工程化就好比让一台发动机成为一辆可以自如行驶汽车的工程化过程。
百度AI中台相关负责人告诉智东西,在过去很长时间里,AI工程化面临以下几个显著问题:
1、AI开发流程长且复杂,行业缺乏规范。AI开发流程大致包括:数据采集和标注、模型训练、应用部署、数据回流和模型观察,没有规范意味着混乱无序。
2、市面上众多AI工具使用门槛高。AI模型面对碎片化场景会效果衰减,企业需要做二次开发,但市面上的AI开发工具不是不好用,就是不符合需求。
3、客户基础设施不完善、内部孤岛严重、人才短缺。比如某银行客户各部门建立的17个云系统,同时各部门孤岛严重、需求难以聚合,加之缺乏专业AI人才,众多因素使得花大成本购入的AI技术成为烂尾工程。
为了应对这些AI工程化难题,整套百度AI中台的价值在文心一言的落地中凸显了出来。
简单来说,百度AI中台是一个助力企业AI模型开发和运维的PaaS平台。其面向金融、能源、互联网、教育等多行业提供人脸识别、OCR、图像、AR、自然语言处理等多种AI能力(文心一言是其中一项AI服务),并帮助其实现简单、快速部署和验证。
百度AI中台相关负责人告诉智东西,一方面,文心一言本身的数据准备、标注、模型训练、应用评估等开发过程,都是基于百度AI中台完成。另一方面用途可能更受企业关注,那就是助力文心一言的应用开发。
具体来说,在文心一言相关模型开发过程中,百度AI中台可提供从数据模型评估、推理优化、数据回流等全生命周期开发工具,以保证模型训练效果。比如:在数据标注环节,百度AI中台提供智能标注方式和标注标准,最高可使成本降低70%;在算力消耗方面,百度AI中台能依照规范提高GPU利用率,能提升资源利用率40%~80%。
总的来说,有了AI中台中一整套工具链,企业将能更好地飞跃产品落地的“最后一公里”,从而实现AI投入变现。
二、生成式AI爆发前夕,产业呼唤更适合跑AI的云
众所周知,算法、算力和数据是AI落地的三大要素。
当下,基于大模型的AIGC正进入爆发前夜,新的海量智能算力需求也随之产生。知名调查机构IDC预测,人工智能产业的软件、硬件和服务有望在2023年突破5000亿美元大关。智能算力成为产业最大增量。
百度AI中台相关负责人告诉智东西,在这种背景下,产业需要“更适合跑AI的云”。
何谓“更适合跑AI的云”?该负责人解读道,从传统思路来看,云计算主要支撑企业数字化,AI契合智能化升级,往往分阶段完成;但现在,很多企业会选择将数字化和AI化一起规划、齐头并进,效率会高得多——这就需要更适合跑AI的云。而随着生成式AI爆发,适合跑AI的云无疑需要支持大模型,支持更高速效的训练和推理,需要更好的异构算力支持。
这位负责人称,百度AI大底座正是提供了这样的新型AI基础设施。
简单来说,百度AI大底座是集百度十年AI研发之大成的“全栈自研的AI基础设施”。百度AI大底座将AI生产全要素,包括自研芯片、大模型、深度学习框架、AI应用集于一身,并可面向企业真实业务场景进行端到端的全流程调优。
纵观人工智能产业,我们看到当下市面上实际上已经出现了“AI大装置”等同类产品。但就像“发动机”有很多车企造,每一家的质量水平有所区别一样,百度AI中台负责人告诉智东西,百度AI大底座相比同行竞品的一大特征就是:“全要素”和“端到端”。
▲百度AI大底座架构图
具体来看,百度AI大底座由前文提到的AI中台、底层百舸异构计算平台两部分构成。百度AI中台是用户“界面”,文心大模型是其中可调用的一个关键模型PaaS服务。百舸异构计算平台是底层基础设施服务平台,通过自研芯片、计算、存储、加速等多方面技术提供加速算力IaaS(基础设施即服务)服务。
▲百度AI大底座产品图谱
这位负责人指出,这种端到端的能力十分关键。比如有些企业可能买了最好的AI模型,但由于在开发中缺乏对数据的标注和结果监控,就导致AI应用中间断层,久而久之AI模型就被闲置了。举个具体案例,比如某银行在布局OCR技术中,曾就有旗下七八个部门采购了不同厂商的产品,并不会考虑数据回流等全链条问题,就导致整体效果大打折扣。
可以看到,基于AI大底座,百度一定程度上建立了在生成式AI爆发前夕的技术优势。根据IDC数据,百度智能云已连续四年居AI公有云市场第一。而这种先发优势,很有可能在AI大模型时代保持叠层效果。
三、AI走向平民化,百度要打造人人能用的AI开发平台
生成式AI的爆发也意味着AI进一步走向“平民化”。
这种核心价值层面的升维,不仅大大提升了AI的知名度,实际上也对AI开发工具提出了更加深刻的要求。
具体来说,大模型本身就帮企业简化了AI工程化流程,企业只需结合业务具体场景进行小样本调优就能获得所需应用。
但与此同时,承载了“平民化”期待的生成式AI,需要在工程化中延续这一“普惠”价值。新的问题就出现了:大模型拥有巨量参数,一次调优涉及的资源消耗依然可观;同时这类技术往往进入企业业务核心,带来更高价值的同时,一旦出问题后果会更严重。
因此要实现真正的AI平民化,一整套高效易用的AI规范与标准、工具平台尤为重要,而这需要产学研多方力量共同努力。
面向AI普惠发展诉求,百度已积极参与行动。2022年底,为了引导产业有序发展,中国信息通信研究院联合百度、阿里、华为、“AI四小龙”等几十家优秀企业编制了MLOps系列标准。MLOps(Machine Learning Operations),简单来说,是指AI开发与运维的全流程。信通院MLOps标准则可以理解为一本汇集AI开发全流程的最佳实践“宝典”,其诞生标志国内AI开发从混乱无序走向标准统一,将大幅提升AI开发质量和效率。
在这一背景下,百度AI中台已首批通过信通院MLOps系列标准,意味着其能够让企业获得最专业的AI开发服务,以业界较低的成本开发出需要的AI应用。换句话说,MLOps标准提供了一套AI软件项目研发和运营的方法论,百度AI中台则为企业提供了对应方法论的“绝佳工具”。
百度AI中台相关负责人说,百度智能云企业AI开发平台的整体能力在需求管理、数据工程和模型开发三个模块均达到了旗舰级水平。
在功能上,百度AI中台具有完善的需求和代码管理流程,AI模型生产过程具备可视化建模、自动化建模、作业建模、工作流等建模方式,对底层计算资源具有完备高效的管理模式,对模型具有全面的管理能力,对数据具有功能丰富的管理平台和质检能力。
在服务过程上,百度AI中台从组织结构到流程管理,再到管理工具方面,均具有较高的服务水平,能够为外部企业客户的需求提供较为快速和较高质量的响应。
百度AI中台相关负责人告诉智东西,在AI基础设施能力获得权威认证背后,AI普惠实际上是百度智能云长期以来的一大核心价值。
这不是一蹴而就的。他回顾道,2016年,百度发布了国内第一个深度学习框架——飞桨,随之百度内部开始“赛马”做多个机器学习平台。2018年,高级开发能力的BML、低门槛开发的EasyDL、以及用户实训比赛社区的AI Studio三大平台脱颖而出。
“分久必合,合久必分”。2020年百度将这三大平台整合,并按照MLOps的过程将业务划分为样本数据中心、开发中心、模型中心和服务运行平台四大阶段板块,基本涵盖了人工智能开发运维的全生命周期。通过2021~2022年的一年三到四次迭代,这一平台最终实现了AI开发低门槛目标。
可以看到,通过八年内部赛马打造百度AI中台,百度正将其“反馈驱动创新”的科学方法论赋能给企业,更将其AI普惠价值传达给行业。
结语:生成式AI风起,云智一体趋势凸显
当下,我国人工智能产业在经历了十几年波峰波谷之后,正乘着生成式AI技术的东风迎来新的春天。凭借技术属性和社会人才等各方面条件,AI技术落地的广度深度延展,正走向规模化、平民化、普惠化。
从企业角度来看,他们正通过接入文心一言等产品的方式,实现数字化与智能化转型的齐头并进。尽管正如科技部部长在两会“部长通道”中所说,国产力量与OpenAI等国际公司仍存在差距。但百度文心一言无疑是国内企业吃到AI技术新红利的一条“快车道”入口。
与此同时,企业接入大平台大模型也只是一个开始。下一步,如何基于AI大模型进行二次开发、数据挖掘、优化调优及部署测试,让AI实现“最后一公里”飞跃,成为更关键的问题。
这也使我们越来越意识到,AI落地是一条算法、算力和数据跨越漫长开发链条的握手合作。产业呼唤更适合跑AI的云,云智一体也成为云计算产业发展的重要趋势。