2023-07-06 16:18:23 作者:宋均益
在AIGC相关技术创新和应用落地过程中,搭建大规模、高性能的计算集群成为了基础架构层面的“行业准入门槛”。 AI模型的训练和推理需要大量的数据计算与传输,计算、网络、存储正在经历前所未有的融合。当网络成为整个算力体系的主要构成要素之一,不仅要在自身技术体系内满足性能、管理和绿色需求,还要将计算和存储场景中的发展趋势纳入创新范畴,创造新一代计算网络、存储网络,实现网联万物、数据通达。
面对新业务、新趋势、新挑战,在近日举办的2023 NAVIGATE 领航者峰会上,新华三集团重磅发布了全系列800G数据中心交换机(H3C S9827系列)、新一代智算AI核心交换机(H3C S12500G-EF )、基于DDC架构的200G NCP、200G NCF交换机(H3C S12500AI系列)、超低时延交换机(H3C S6116系列)等多款新品,全面支持不同场景下的算力需求,为加速AIGC应用落地构筑极致的网络能力。
全系列800G交换机引领智算网络超宽进化
要想富,先修路;在加快数据中心建设、应对算力需求增长的过程中,这句老话同样适用。选择具备更高端口速率和交换容量的交换机就相当于为城市修建更宽的路网,由此既能提升计算集群内部的数据交换能力,也能拓展计算集群的规模上限,为后续的升级扩容做足前提。从400G升级到800G,对于硬件设备而言,关键器件的功耗也将提升一个量级,如何在实现高速传输的同时,兼顾能耗降低的诉求,对于技术的落地应用提出了极大挑战。
新华三集团在800G交换机产品家族硕果累累,领先业界。其中,H3C S9827-64EO是全球首款单芯片51.2T800G CPO硅光数据中心交换机,适用于AIGC集群或数据中心高性能核心交换等业务场景中,基于CPO硅光技术,将负责数据交换的NPU与TRX光电转换模块进行统一封装,以此减少交换机内部的电路复杂度、线路延迟和传输损耗。H3C S9827-64EO实现了单端口传输时延度降低20%,这意味着在单位时间内,AIGC集群中GPU的数据交互能力可以提升25%,大大提升GPU的运算效率。与此同时,产品单芯片带宽达51.2T,可支撑单个AIGC集群规模突破3.2万台节点,助力单集群吞吐量提升8倍。
面对超长距离DCI互联场景,H3C S9827-64E 800G标准款交换机作为家族的另一款明星代表,全面满足DCI超长距120KM传输。设备高度仅为2U,但数据交换能力则达到惊人的51.2TB/s,提供了64个800G高速以太网端口,不仅能胜任数据中心核心交换、互联的重任,更能支持上万节点的AI计算集群。
内置AI,智能无损技术保障关键业务“直达”
在实际运行中,以太网中1%的丢包率就会导致计算集群50%的性能损失;而对于大模型、AIGC应用等,对集群规模和性能有着强需求的业务应用而言,这些性能损失显然是无法接受的。针对以太网的这一底层设计弊端,新华三集团通过在传统交换机中融入AI的能力,在“不改变规则”的前提下找到了解决之法。
最新发布的新一代智算AI核心交换机H3CS12500G-EF适用于大中型数据中心核心节点,具备400G的超大带宽并支持平滑升级到800G,通过链路状态感知、流量编排和智能调优等一系列技术的综合运用,能够在庞大流量中精准识别关键业务,并根据链路状态为关键业务开辟“绿色直达通道”,而且这一过程也是动态且可编程的。由此,新华三既保留了以太网协议的便利性和兼容性,又为实际业务解决了丢包顽疾并降低了转发延迟,实现了真正的关键业务数据无损,对于使用动辄几十万的计算卡构建起来的高成本计算集群来说,无损网络所带来的效率提升具备极高的成本和业务价值。经测算,新华三无损以太网方案与传统网络相比,I/O性能提升121%,I/O时延降低55%,在拥塞场景下时延降低98%。
与此同时,为了进一步提升智算网络整体可用性,新华三也推出了基于DDC架构的200G NCP、200G NCF交换机产品H3C S12500AI系列,以更具扩展性、更易运维管理、更具成本效益的分布式解耦机框方案为用户构建天然零丢包的无损网络,有效降低端到端时延和抖动。产品提供自动化部署以及NCF与NCP的自组网能力,实现新增网元上线即可用,并且在网元失效时实现us级的拓扑收敛速度,极大提升智算网络整体可用性。
风冷液冷融合散热,践行绿色设计理念
能源效率的提升是所有技术和产业高质量、可持续发展的前提。而新华三集团也将绿色低碳理念融入交换机产品研发设计当中,采取了“两条腿走路”的方法。首先,新华三通过提高交换机芯片工艺制程和CPO技术应用等多种手段来降低交换机核心组件的能耗,将数据信号从传统的PCB互联直接跨越到光IO互联,极大降低了芯片用于克服传输阻抗所付出的功耗,实现单集群内的TCO降低30%。其次,新华三还通过在交换机内整合冷板式液冷、AI优化风扇运行策略、风道优化设计等一系列技术来提升交换机的整体散热效率,让交换机整体能效再进一步。例如,在H3C S12500G-EF交换机中,多种散热技术的综合利用则使交换机持续运行的电力成本降低了40%、碳排放降低了58%。
精耕细分场景,超低时延交换机助力金融交易“纳秒必争”
新华三集团的数据中心网络创新不止发生在AIGC大模型领域中。面向金融行业的量化交易、高频交易场景,新华三最新推出了L1(S6116-48X)、L1.5(S6116-48X-M)、L3(S6826-48Y8C/S9826-32C)全系列超低时延交换机,以业界领先的时延性能打造出覆盖行情、交易、风控等全业务场景的极速交易方案。
●L1(S6116-48X)超低时延交换机通过逻辑矩阵定制化设计,完美契合行情广播下发场景,既可提供最小1.5ns的转发时延,也具有普通以太网交换机的可维护性;
●L1.5(S6116-48X-M) 超低时延交换机进一步引入了业内领先的FPGA链路复用、精准时间戳处理等技术,主要在极速交易场景中完成策略机上行数据的多路复用,及行情数据及回程数据的链路解复用,可实现最小35ns的数据转发时延。
●L3(S6826-48Y8C/S9826-32C) 超低时延交换机支持丰富的二、三层特性,可提供最小450ns的数据转发时延,显著提升极速交易网络传输效率。
目前,新华三S6116系列低时延交换机已得到多家高频交易系统、期货、证券等客户的广泛应用和高度认可,将进一步推动极速交易在证券期货领域的快速发展,助力市场流动性和效率的提升。
高速高效的联接万物是网络定义的本源,也是联接当下与未来的核心通路,更是新华三集团网络技术创新自始至终的追求。未来,新华三将秉承“精耕务实,为时代赋智慧”的理念,通过网络技术的“多向融合”、“多头创新”, 为海量业务及其背后的百行百业带来全新数字化价值。