被公众誉为“AI教主”的NVIDIA创始人兼CEO黄仁勋,曾在2023年GTC大会上指出“AI的iPhone时刻”已来临。面对以大模型为代表的生成式AI的迅猛发展态势,“三芯+二意,打造AI世界”成为加速计算和生成式AI的成功秘诀,而他的带领之下,英伟达团队撰写了一本“AI背后的武林秘籍”。
2023年10 月 17 日,在“揭开AI背后的武林秘籍”发布会现场,NVIDIA全球副总裁,中国企业营销负责人刘念宁和NVIDIA中国区工程和解决方案高级总监赖俊杰分别身着绿色武侠装,在台上正式揭晓了三只宝箱中封存的秘籍——《数据处理器:DPU编程入门》。
在AI时代扑面而来的今天,相信有越来越多的普通人已经意识到,AI给其带来的诸多正面影响,远超一个智能机器人的范畴。AI不仅日益贴近人类的生活,还在改变生产力方面发挥着重要作用,让许多行业迎来革命性的变化。
在支撑AI发展的过程中,作为计算单元的数据中心发挥着关键作用。黄仁勋曾表示:”如果数据中心是计算机,那么网络就定义了数据中心“。为了满足AI工厂和生成式AI云的需求,为大规模AI模型需要的大量GPU计算提供数据中心级别的良好性能,NVIDIA定位了不同类型的AI数据中心基础设施网络。其中,需要说明的是,数据中心拥有很多不同的组件,这也包括黄仁勋提到的“三芯”,即CPU、GPU和DPU。
CPU和GPU我们已然不再陌生,那么,DPU是什么呢?DPU(Data Processing Unit,数据处理器)简单来说就是面向以数据为中心的计算的新一代处理器。它的出现,能够代替CPU执行数据中心中安全、网络、存储等基础架构操作,进而帮助CPU和GPU的计算资源更好地集中于应用程序和业务负载上。因此,DPU也和CPU及GPU一同构成了新型计算的三大支柱。
具体到大模型训练上,DPU能发挥什么作用?赖俊杰表示:“DPU可以更加有效或者更快地做好数据传输这件事情,最终的计算任务就是训练一个大模型,任务会被拆解成不同的部分,在任务处理上也不会有短板,能够把GPU的利用率尽可能提高,同时把DPU利用好,做好数据的传输。”
在此发展背景下,为给现代数据中心和超级计算集群带来更进一步的创新,NVIDIA发布了NVIDIA BlueField 系列DPU,通过对各种高级网络、存储和安全服务进行卸载、加速和隔离,来为云端、数据中心或边缘计算等任何环境中的任何工作负载提供安全、加速的基础设施,从而极大地推动性能加速。
同时,为了让开发者快速创建基于DPU加速的高性能应用,NVIDIA也为NVIDIA BlueField系列DPU量身定做了一个名为NVIDIA DOCA的软件开发环境,助力DPU潜力的释放。
刘念宁表示:“NVIDIA BlueField系列DPU在NVIDIA DOCA软件开发环境的支持下,能帮助企业构建一个软件定义、硬件加速的数据中心基础设施,从而更好地支撑大模型训练的苛刻要求,值得广大开发者投入研究和学习。”
2021年6月,NVIDIA启动了DOCA 中国开发者社区,不仅为社区成员提供丰富知识,还举办DPU 中国黑客松竞赛、DOCA代码开源活动等重点活动,逐渐将其发展成为全球最活跃的DOCA开发者社区。如今,全球的DOCA开发者有将近一半来自中国,并且还在持续增长中。这些开发者包括初创公司、企业客户、生态合作伙伴、学生和老师等,他们迫切需要一本由浅入深、化繁为简的入门书籍,来帮助其更好地学习DPU和DOCA。正是在此发展现状下 ,NVIDIA撰写并推出了《数据处理器: DPU编程入门》一书。值得一提的是,这也是NVIDIA的全球首部DPU处理器编程入门书籍。
据了解,《数据处理器: DPU编程入门》一书由机械工业出版社出版,编委会由18位 NVIDIA中国员工组成,其中有17位是资深系统架构师。
NVIDIA网络市场总监孟庆指出:“书籍的编委会成员主要来自赖俊杰博士领导的系统架构师团队。他们都是在第一线接触客户的资深系统架构师,非常了解客户的实际需求和应用场景,他们自愿利用自己的休息时间和业余时间撰写了各个章节的内容,在互相交流的过程中完成写作,保障内容通畅和可读性。”
从内容上看,该书共分为五大部分十个章节。详细来说,五大部分分别讲述了DPU的技术发展背景、NVIDIA BlueField DPU的概述及应用、NVIDIA DOCA概述及开发体验、NVIDIA DOCA开发实践,以及生态体系与网络平台。基于本书,读者会拥有一个对DPU自身、DPU市场现状和未来应用场景的宏观初步认识,并学习到如何在NVIDIA DOCA的软件架构上搭建开发环境,另外还能了解到一些经典的NVIDIA生态合作伙伴应用案例。
NVIDIA网络技术专家崔岩表示:“我们当时在策划这本书的时候就是将其作为一个入门的书籍。考虑到一些DPU的核心技术特性,我们对读者也有一些画像和定位,大概分为三个方面。”
首先,读者要对网络基础有一定的知识理解;其次,由于是在Linux的环境中开发和配置使用,因此要求读者对Linux的命令和日常使用需要具有一定的基础知识;此外,由于是以C语言开发为主,因此需要读者掌握比较通用基础的语言。更进一步来说,最好拥有已安装DPU的服务器环境,以便更容易地实现想要开发的创意软件或者服务。
从该书的定位可以看出,其目标读者主要包括没有DPU开发经验的普通开发者、具有DPU开发经验的工程师,以及数据中心管理人员和开发运维人员。书籍内容能够帮助普通开发者快速掌握DOCA软件开发技能,帮助有经验的从业者更系统地学习DOCA软件开发环境,了解更多DPU的应用范畴,帮助数据中心管理和运维人员更好地在数据中心部署和使用NVIDIA BlueField DPU和NVIDIA DOCA应用程序或服务,甚至帮助做大模型的科研人员和学生提高效率、减少工作量。
据悉,目前《数据处理器: DPU编程入门》一书已经正式上市发行,读者既可以通过机械工业出版社的京东自营官方旗舰店、当当自营官方旗舰店和天猫旗舰店等线上渠道购买,也可以在各地区的新华书店等线下渠道购买。
对于该书的未来销量,机械工业出版社内部也初步定下了一个小目标。据机械工业出版社华章分社计算机图书事业部总经理杨福川透露:“计划在第一阶段达到10000册的销量。为什么是10000册呢?因为这是当下畅销书的分水岭。”
另外,他也指出,在云计算、大数据和大模型的发展和普及的背景下下,DPU的应用场景会越来越多,随着DPU技术的逐渐成熟,会有越来越多的开发者和应用加入到这个大生态中来未来也一定会有更多相关的书籍和课程被开发出来。
事实上,在AI的热潮之下,NVIDIA已经凭借在AI领域取得的突破,实现了股价翻倍,并成功地达到万亿美元以上的市值。在加速计算和生成式AI成功秘诀和秘籍的指导下,相信由“AI教主” 黄仁勋带领的NVIDIA将走向更长阔的发展之路。