当前位置:首页|资讯|百度|旷视|深度学习

持续耕耘四年后,百度飞桨定义了一套深度学习开源平台的游戏规则

作者:赵赛坡商业评论发布时间:2024-01-10

原标题:持续耕耘四年后,百度飞桨定义了一套深度学习开源平台的游戏规则

2020 年的开年充满了各种不确定性,但在人工智能领域,深度学习依然肩负着人工智能技术突破与行业落地的重任。

本周,引领国内AI开源的百度也首次向业界展示了基于飞桨(PaddlePaddle)的 PaddleCV(计算机视觉)全景图,并带来视觉能力的三大更新;旷视科技随后也宣布开源旗下的深度学习框架 MegEngine;过两天,华为还将开源自家的AI计算框架Mindspore。

百度已是在深度学习领域耕耘多年的巨头,华为在IT 界的江湖地位不用多说,旷视则是依托计算机视觉快速发展的行业新贵。不难看出,深度学习框架/平台正在受到国内AI厂商越来越多的重视。其背后的考量,既有对于深度学习技术潜力的预期,也隐藏着对深度学习行业落地并赋能产业的雄心。

此时不妨抛出一个「X乎式」的模糊命题:如何看待当下国内深度学习开源平台的格局?而要回答这样一个宏观的问题,需要先理解一点:为什么开源开放的框架/平台对于深度学习如此重要?

开源开放平台对深度学习从业者意味着什么

2012 年之后所兴起的人工智能热潮,离不开三大要素的支撑:算力、数据与算法。

其中,「算力」和「数据」是硬件摩尔定律与软件互联网服务发展的必然结果,而「算法」层面的创新则是作为机器学习子域的深度学习的技术突破——它解决了过往传统算法无法应对的语音、图像以及自然语言处理中的多个难题——从而成为学术和产业界的新宠儿。

公开资料显示,2015 年 11 月,Google 正式开源 Tensorflow;2016 年 9 月,百度宣布飞桨(PaddlePaddle)开源;2017 年 5 月,Facebook 给深度学习开发者带来了 Cafe2。

无论是 Tensorflow 还是飞桨(PaddlePaddle),为深度学习从业者带来多重价值。

首先,对于绝大多数开发者甚至企业而言,前文提及的「算力」、「数据」与「算法」几乎也是三个无法越过的门槛,深度学习平台则提供了一个类似「搭积木」的平台。

通过将不同模型、算法以及数据集放在一起,开发者可以根据自己的需求,挑选适合自己的算法、数据集,最终快速训练出一个模型,从而大大降低了深度学习以及 AI 开发的门槛。

其次,Tensorflow 与飞桨(PaddlePaddle),都是从自身复杂的业务体系里抽离出的技术架构。换句话说,这些平台上的技术(包括算法、模型等),已经在 Google、百度的复杂业务里应用并得以验证,它不再是停留在实验室里的「屠龙术」,而是可以应用在业务环境里的实战技能。

以飞桨(PaddlePaddle)为例,作为百度大脑的核心基础,飞桨(PaddlePaddle)拥有开发便捷的深度学习框架、超大规模模型训练、高性能推理引擎、产业级开源模型库4大核心技术。

目前已经形成了从开发框架、开发套件到工具组件、服务平台的技术和产品布局,覆盖了不同开发阶段、不同业务场景的深度学习研发需求。这意味着,即便是个人开发者,都可以利用飞桨(PaddlePaddle)提供的平台和能力,快速训练、部署自己的深度学习模型,这种「站在巨人肩膀」的创新俨然成为 AI 时代软件开发的潮流。

第三,深度学习开源平台也是一个不断进化的服务平台。从 1.0 到 2.0,Tensorflow 小步快跑,不断提升开源平台的各项能力;而从 1.0 到 2.0 再到 3.0,高频迭代的飞桨(PaddlePaddle),已经构建起完整的架构和产品布局。

这些版本号升级的幕后,离不开 Tensorflow 与飞桨(PaddlePaddle)团队工程师的努力,更是开源社区里全球各地深度学习从业者们共同努力的结果。

作为行业先行者的 Google、百度,通过将内部的核心技术开源,并在与开源社区的不断反馈中迭代平台架构,Tensorflow 也好,飞桨(PaddlePaddle)也罢,过去几年俨然形成了一条全新的「护城河」,对于后来者,譬如旷视和华为,没有长时间的投入,想要跨过这条「护城河」的难度可想而知。

深度学习平台之于产业与国家的意义

利用开源的深度学习平台,越来越多的行业开始拥抱深度学习,技术突破之后的产业赋能探索,也在推动深度学习开源平台的新发展。

在国外,从互联网产品到医疗诊断,Tensorflow 等深度学习开源平台不断改变着这些行业的游戏规则。

而作为最早应用深度学习的科技公司之一,百度不仅将深度学习应用在内部的搜索、语音输入法、地图等产品上,还在通过飞桨(PaddlePaddle)持续赋能各个行业。公开资料显示,目前,飞桨(PaddlePaddle)已累计服务超过150万开发者,拥有超过6.5万企业用户。

譬如在工业领域,大恒集团应用飞桨(PaddlePaddle)进行多种产品外观质检模型研发与部署,打造的质检一体机实现了工业质检效率的显著提升,并已在在电池隔膜缺陷质检产线上进行全面落地;在林业领域,北京林业大学基于飞桨(PaddlePaddle)打造的林业虫情监测系统,可准确识别红脂大小蠹,将原本需要两周的检查任务缩短至1小时,助力林业虫害防治。

随着人工智能持续而深刻地影响各个行业,深度学习平台之间的竞争,俨然也成为国际竞争的重要领域,从 PC 到智能手机,掌握操作系统的几家美国公司成为这个星球上最赚钱公司,还紧紧握着全球科技发展的「命脉」。

当近几年国内 IT 行业「卡脖子」不断上演的时候,百度飞桨(PaddlePaddle)一直「默默」肩负着推动中国深度学习开源生态发展的重任

早在 2017 年,由百度牵头,联合清华大学等多家机构,共同筹建深度学习技术及应用国家工程实验室。依托这个实验室,飞桨(PaddlePaddle)与国内多家科研机构及高校合作研发领先的深度学习技术,为中国的深度学习研究者、企业和开发者提供功能全面、技术领先的中国开源深度学习平台。

其次,通过面向企业的「黄埔学院」、针对高校的「飞桨博士会」、「深度学习工程师认证」等举措,构建中国深度学习开发者生态,2019 年的 WAVE SUMMIT深度学习开发者峰会上,百度还宣布了 AI Studio 算力支持计划,开放价值一亿元的免费算力资源,助力开发者成功。第三,飞桨(PaddlePaddle)与华为、浪潮的中国企业达成重磅合作。其中, 2019 年 7 月的百度 AI 开发者大会上,飞桨(PaddlePaddle)与华为麒麟芯片达成深度合作,将中国的芯片与中国的深度学习开源平台紧密结合在一起。而百度与浪潮的合作,双方将共建百度飞桨(PaddlePaddle)与浪潮AI Station 联合方案,为深度学习开发者更便捷、高效地在浪潮AI服务器上应用飞桨(PaddlePaddle)深度学习能力提供了坚实基础。

上述这些行业赋能与产业和合作的案例,凸显出飞桨(PaddlePaddle)在国内深度学习开源领域的影响力,结合 IDC 2019 年的一份调查来看,在中国企业采用的业界深度学习开源平台中,百度飞桨(PaddlePaddle)仅次于 Tensorflow 和 Pytorch,继续成为推动中国深度学习开源平台发展的重要力量。

写在最后:深度学习平台非一日之功

如果从 2016 年 9 月百度开源国内首个深度学习平台飞桨(PaddlePaddle)算起,这个由百度开启的新赛道在国内出现还不到四年时间,而在这个略显动荡的 2020 年春天,旷视、华为、清华等企业、高校推出的深度学习开源框架,进一步助推了深度学习行业的热度,也为中国发展自主可控的深度学习开源平台提供新的可能性。

「新基建」的政策红利下,国内产业智能升级的步伐持续加快。作为向下连接芯片,往上对接企业业务和行业应用的关键产品,深度学习开源平台的重要性不言而喻,正如百度 CTO 王海峰所言,「深度学习框架是智能时代的操作系统」,也因此,未来这个领域的竞争还将持续。

但必须看到的是,面向深度学习的开源平台「既不能一天建成」,也不能仅仅依靠某个突破性的技术而快速成功,它是将先进技术、行业理解以及生态协同结合后的「新物种」,Tensorflow 如此,飞桨(PaddlePaddle)亦是如此。

过去近四年的时间里,飞桨(PaddlePaddle)从无到有,从小到大,一步步成长为扎根中国深度学习开发者并提供业界领先技术与产品的开源平台,探索出了一条深度学习技术与产业深度融合的新赛道。

在百度开启的赛道上,飞桨(PaddlePaddle)的技术迭代与行业落地实践,为整个行业树立了样本,同时也为后续越来越多的国产化开源框架提供了参考。(完)


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1