[中国,北京,2024年9月3日] 以“赋能新质生产力 打造算力新时代”为主题的2024开放数据中心大会(以下简称ODCC 2024)在北京国际会议中心顺利举办。本次峰会汇聚众多业内精英,共同探讨新形势下,数据中心各个领域的最新动态和发展方向。华为受邀参加了包括主论坛、新技术与测试分论坛以及网络分论坛在内的三场活动,并发表了精彩的演讲。
华为数据通信产品线数据中心网络领域副总裁 李建高发表主题演讲
华为数据通信产品线数据中心网络领域副总裁李建高在主论坛发表“华为星河AI数据中心网络,加速形成新质生产力”主题演讲,他表示:“随着AI大模型的参数量和数据集规模剧增,超大规模集群数据中心网络面临的单POD组网规模瓶颈、算卡等待造成算力浪费以及网络可靠性不足导致训练中断等挑战。为此,华为推出了星河AI数据中心网络方案。该方案基于DF+星织创新架构,突破了AI集群的规模上限;同时,采用独家网络级负载均衡NSLB算法,实现路径规划,消除网络性能瓶颈;最后,该方案依托光模块通道抗损及脏污检测技术,使网络可靠性提升了超过10倍,从而为加速形成新质生产力提供了重要的基础支撑。”
华为数据通信产品线数据中心网络首席规划师 温华锋发表主题演讲
在网络分论坛上,华为数据通信产品线数据中心网络首席规划师温华锋发布“扁平化组网架构”主题演讲,他指出:“对于任意规模的智算网络,均需要扁平化组网架构,网络越扁平,成本越低,性能越好,可靠性越高。对于不同规模的集群,我们提出了三种组网架构建议。对于小型规模,建议采用一层框或盒的组网架构;对于中型规模,建议采用框盒两层组网架构;而对于大型及超大规模,则建议采用星织组网架构,这种架构能将网络层数减少至2.5层,与同收敛比的三层胖树相比,可以获得成本优势,同时保持相当的性能。未来,我们希望与产业伙伴协同合作,统一网络架构的评价体系,共同推进扁平化组网架构。”
华为产业标准代表 吕云屏发表主题演讲
在新技术与测试分论坛上,华为产业标准代表吕云屏发表“面向大规模AI集群的传输技术思考”主题演讲,她表示:“随着AI集群规模的不断扩大,流量冲突对传输性能的影响愈加显著。应对此挑战,我们提出将有损和无损技术路线相结合的数控分离传输架构,并配合靶向速率控制算法,有效提升网络吞吐,降低流量尾时延。初步的仿真和测试结果显示出明显的性能增益。我们将持续进行验证和深入探索,期待与产业伙伴协同合作共同推动智算的建设发展。”
峰会上,由华为主导并与ODCC生态伙伴联合推出的《AI数据中心网络建网参考报告》在众多项目中脱颖而出,被ODCC 网络工作组评选为2024开放数据中心大会优秀项目。华为产业标准代表吕云屏凭借《跨集群训练(Region Scale AI)技术需求报告》项目,获得优秀项目经理。
华为星河AI数据中心网络解决方案基于差异化技术创新优势获得客户的认可,并在金融、政府、互联网、制造等行业广泛应用,加速千行万业数智化转型。面向未来,华为将继续与产业伙伴协同合作,深化数据中心网络领域的研究与创新,推动网络智能化升级和代际演进,为客户和产业创造更大价值。