爆红智能AI如何看待DPU ChatGPT这样说

作者：爱集微APP发布时间：2023-02-09

上线仅2个月，OpenAI的最新一代产品 - AI聊天机器人ChatGPT月活用户接近1亿。

作为自然语言处理（NLP）领域的前沿研究成果之一，ChatGPT已成为AIGC里程碑式的产品。

这周我们也与ChatGPT聊了聊他/她对大规模预训练背后所需资源的看法。

让我们一起来看看ChatGPT的回答是否能让你满意呢？

强大的语言生成能力现在引起更多讨论的是规模预训练。在过去的很长一段时间里，许多的AI厂商都是通过本地设备来进行训练的。

GPT-3所训练的参数约为1750亿个，这部分需要大量的算力，而目前我们已知ChatGPT导入了至少1万颗英伟达高端GPU来训练模型。

业界部分专家认为GPT-4训练参数可能会达到100万亿个参数，如此大规模、长时间的GPU集群训练任务，也对网络互联底座的性能、可靠性、成本等各方面都提出了极致的要求。

面对千亿、万亿参数规模的大模型训练，仅仅是单次计算迭代内梯度同步需要的通信量就高达TB量级。此外还有各种并行模式、加速框架引入的通信需求，使得传统低速网络的带宽远远无法支撑GPU集群的高效计算，甚至成为了其中关键的瓶颈。

因此要充分发挥GPU计算资源的强大算力，必须构建一个全新的高性能网络底座，用高速网络的大带宽来助推整个集群计算的高效率。

以CPU+GPU的异构计算模型已经成为高性能计算领域中的主流计算架构。而高吞吐、低延时是高性能计算场景中最为迫切的应用需求。

我们可以知道，GPUDirect RDMA是RDMA在异构计算场景中的应用延伸，使得GPU之间的通信不在依赖CPU转发，从而进一步提升高性能计算场景中整体算力。

从DPU芯片的实现角度看，不同DPU厂商的核心竞争壁垒在于专用加速引擎的硬件实现上。由于DPU是数据中心中所有服务器的流量入口，并以处理报文的方式处理数据，在网络芯片领域积累更多的厂商将更有优势。

传统的GPU在访问存储时，需要将数据先搬移到系统内存，再由系统内存搬移到目标设备。而采用DPU介入后可以绕过CPU，直接通过PCIe访问远端的NVMe设备，加速AI训练，大大降低CPU的开销。

在AI/ML领域的工作负载对于存储系统的要求十分苛刻，目前此类应用已主要采用全闪存存储，其中NVMe全闪存逐渐成为主流趋势。同时存储与前端应用主机的网络存储协议开始采用NVMe over Fabrics(NVMe-oF)。

NVMe-oF是一种存储网络协议，通过网络将NVMe命令传送到远程NVMe子系统，以利用NVMe 全闪存的并行访问和低延迟，该规范定义了一个协议接口，旨在与高性能fabric技术配合使用，包括通过实现RDMA技术的InfiniBand、RoCE v2、iWARP或TCP。

NVMe-oF是一种使用NVMe协议将访问扩展到远程存储系统的非易失性存储器（NVM）设备的方法。这使得前端接口能够连接到存储系统中，扩展到大量NVMe设备，并延长数据中心内可以访问NVMe子系统的距离。NVMe-oF的目标是显著改善数据中心网络延迟，并为远程NVMe设备提供近似于本地访问的延迟，目标为10us。

我们知道AI对计算的需求非常大，目前主流的AI加速还是以GPU、FPGA和一些专门的AI芯片等为主。在GPU、AI芯片用于AI计算之前都是CPU承担计算的任务，CPU的效率难以满足需求，从而产生CPU+GPU+ASIC的异构计算。随着DPU的出现，这种异构计算的发展更加彻底，可以更大提供并行处理能力，适合大规模计算的发展。

支持Chiplet技术的超异构算力芯片，伴随着AI/ML的发展将会得到更好的应用，而支持Die-To-Die互联技术将能够提供互联其他AI芯片和算力单元的巨大能力，摆脱一直以来PCIe发展的限制。

拿芯启源自身举例，以支持高级AI为主要目标之一的芯启源最新的DPU芯片，其架构中就应用Chiplet技术。不仅提升了自有智能网卡的性能，通过支持与第三方芯片的Die-To-Die互联，还可以集成更多的特定专业领域的芯片，比如AI训练中的GPU芯片。

虽然PCIe非常的标准，但是带宽非常有限的，PCIe Gen3的理论带宽是32GB/s，PCIe Gen4的理论带宽是64GB/s，而实测带宽大概分别是24GB/s和48GB/s。

在AI训练中，每完成一轮计算，都要同步更新一次参数，也就是权系数。模型规模越大，参数规模一般也会更大，这样算力芯片的效率会收到PCIe架构的限制，支持更高能力层次的互联技术讲彻底解决带宽限制和瓶颈，极大提升单节点计算效率。

和ChatGPT聊了那么多，最后再让我们来看看他/她对于DPU应用了解多少呢？

爆红智能AI如何看待DPU ChatGPT这样说

推荐体验

相关资讯

如何看待“GPT之父”被解雇？ChatGPT和它们这样说

如何看待和利用ChatGPT类语言模型？专家这样说

如何看待ChatGPT爆火背后潜在的法律风险

如何看待爆火的chatGPT～深度好文 | 社区征文

“ChatGPT们”投资前景如何？全球科技基金经理这样说

近期资讯

中航光电获得实用新型专利授权：“一种水下接线盒组件”

下一个增长点！英伟达杀入人形机器人赛道：行业要变天

红蜻蜓加绒加厚假两件针织衫官方清仓 73款可选 39元

华为鸿蒙 NEXT 系统“超级终端”新增适配部分 Sound 系列音箱

印度空间研究组织（ISRO）：成功完成太空对接任务发射

重装系统全攻略：让你的电脑重获新生的详细步骤与注意事项

一场化工AI大赛，点亮行业智能化的星星之火

印度警方用鸟拦截无人机

智己官宣：正式取得L4无驾驶人智能网联汽车道路测试牌照

世界都市生活加速趋同但分歧的拉锯战还在继续

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响