AIGC时代,需要什么样的网络“利器”?
“
作为数字化解决方案的领导者,为百行百业构建高品质网络联接,亦是新华三推进AI in All战略的重要一环。
本文字数3561,阅读时长约11分钟
文|
财经E法
姚佳莹
编辑|朱弢
在国内外企业争相涌入通用AI大模型的赛道时,新华三做出了自己的选择。
“我们的选择是基于自身多年的B端经验,为客户提供具有数据安全保障的私域大模型和ICT算力底座。在公域大模型方面,我们选择专注于底层能力,算力、网络联接、软件等。”新华三集团副总裁、网络产品线总裁曾富贵对经E法表示:“与其争相淘金,我们更希望给淘金者卖一些好用的‘铲子’,把专长发挥到极致。”
新华三不仅要造“铲子”,还要造出最锋利的“铲子”。
AIGC的爆发影响的不仅是产业智能化进程,其更为深远的意义在于,各行业开始思考如何加速应用创新。网络联接作为重要的数字化基础设施,成为搭建上层智慧应用、发挥算力价值的重要一环。超高带宽、智能无损、智算能力升级、算网融合成为网络进化的重要方向。
曾富贵表示,在新华三看来,网络领域的重要发展趋势包括:业务快速迭代、AI驱动算力加速、全业务云化、IPv6全面应用、以及网络与业务应用深度融合,对此新华三集团坚持以“应用驱动网络”为核心理念,提升网络的随需应变与迭代创新能力,为园区、数据中心、广域网三大场景应用打造智能、融合、极简、可信、超宽的网络底座。
顺应智能化时代趋势,在2023 NAVIGATE领航者峰会上,新华三同时发布了包括新一代数据中心交换机、智算解决方案、全场景Wi-Fi 7 AP、5G确定性网络解决方案在内的十余款重量级产品技术及解决方案,为百行百业构建高品质网络联接。
01
打造超高带宽网络
具体到AIGC领域,曾富贵表示,AI模型的训练和推理需要大量数据和计算结果的传输和存储,这对于基础底座的网络性能要求极高,将直接决定用户能够最终获得多少算力,网络成为算力体系的关键要素。
中国的算力规模达到多大体量?IDC预测,2022年中国智能算力规模将达到268.0 EFLOPS(EFLOPS,即每秒百亿亿次浮点运算),超过通用算力规模,预计到2026年智能算力规模将达到1271.4 EFLOPS。2021年-2026年,预计中国智能算力规模年复合增长率达52.3%,同期通用算力规模年复合增长率为18.5%。
算力网络成为新的基础设施。根据国家信息中心发布的《智能计算中心创新发展指南》显示,目前全国已有超过30个城市在建或筹建智算中心。4月,科技部表态,正在推动算力网建设,打造智算的算力底座。
而随着AI技术的创新迭代,除了AIGC,数字人、多模态、智能决策等应用场景亦为人工智能市场的增长带来了更多想象空间和可能性。IDC预计,2026年中国AI市场将实现264.4亿美元市场规模,2021年-2026年的复合增长率将超20%。
作为面向行业的ICT服务商,人工智能场景的进一步落地、算力规模高速增长,无疑是新华三的新机遇。
“大模型训练需要海量的数据,联接的服务器越来越多,意味着提高网络联接能力的需求越来越强,客户对数据中心交换机处理能力提出了更高的要求。”曾富贵表示。
作为ICT的关键设施,交换机具有网络互联功能,能为子网络提供更多的连接端口,提高网络效率和安全性。大模型训练对交换机网络联接能力的要求主要体现在两个方面:其一是高吞吐量,AIGC训练过程中,大规模数据需要无阻塞地传输;其次是低时延,数据中心内部数据流量极大,AIGC训练过程中,AIGC集群进行分布式深度学习训练时,不同节点间需频繁同步模型参数,一旦出现网络延迟问题,将会对训练效率和结果产生严重影响,因此对网络时延有着极高要求。
新近发布的800G CPO硅光数据中心交换机的单芯片带宽为51.2T,支持64个800G端口,旨在实现智算网络高吞吐、低时延、绿色节能三大需求。相较400G交换机,800G CPO硅光交换机可实现单集群吞吐量提升8倍,满足单个AIGC集群3.2万GPU的容量,且产品融合了CPO硅光技术,将单端口传输时延再度降低20%,这意味着在单位时间内,AIGC集群中GPU的数据交互能力可以提升25%,大幅提升GPU的运算效率。此外,可将数据信号从传统的PCB互联,跨越到光互联,极大降低了功耗,单集群可降低30%的TCO支出。
在中国的数据中心用交换机市场,新华三是主要的设备供应商之一。根据IDC数据,2023年第一季度,新华三占有中国数据中心用交换机市场31.2%的市场份额,并且常年保持在前三位置。
虽然新华三的产品已在市场上占有先机,但曾富贵表示,如今GPU性能上升非常快,对网络联接设备提出大带宽、高性能、低时延、低功耗等更高要求,800G硅光交换机是技术演进和市场需求双向催生的成果。其次,800G硅光交换机的发布恰逢其时,上下游产业链发展已趋成熟,确保产品不会滞后、或过度超前于行业需求。
在新的机遇面前,新华三亦将抓住AI热潮,为其产品赋能。曾富贵表示,AI的能力正呈指数级提升,各个行业都密切关注其发展态势,希望用AI迭代甚至重塑整个行业,新华三也不会在这一热潮中置身度外。
02
实现算力的无损传输
除了带宽限制,丢包率是影响数据中心网络性能的另一大核心参数。在进行AI训练时,即使GPU能力得到提升,但倘若数据传输过程中仍存在丢包,延时等问题,将造成算力资源的浪费。
“AI大模型的开发过程包括训练阶段、推理阶段,都需要数据的大量传输和计算,即使有个别数据出现错包、丢包,这次计算便得重新进行。”曾富贵表示,网络无损简而言之便是确保网络数据传输100%不会丢包。
新华三集团计算存储产品线副总裁刘宏程表示,目前观察到的用户实践,客户要求无损网络,包括RDMA(Remote Direct Memory Access,远程直接数据存取)等,因为客户网络中哪怕丢一个数据包,此前几十个小时的数据训练可能都要重新来过。“这意味着,算力的利用率会降到非常低的水平,我们见过客户因为调度不灵活,算力甚至只用了5%、10%,服务器可以说在空转。”
“每跨一台服务器,性能便会有一定的削减,这个削减来源于服务器之间互联和数据之间的调度,比如存储数据怎么获得,两台不同的服务器之间网络带宽和延迟是多少,这些都是整个AIGC解决方案里需要综合考虑的部分。”刘宏程表示。
在无损网络技术方面,新华三最新推出的新一代S12500G-EF智算AI核心交换机,即可实现超宽无损的数据中心网络,并能进一步节能降耗,引领算力平台的全面进化。曾富贵介绍道,新华三的智算无损方案使用AI算法监测网络负载、计算资源的能力,通过参数学习,AI会自动调整网络参数,达到网络负载合理、无阻隔的状态。
03
AI in All 助力实现千亿目标
早在2020年,新华三就发布了AI in All 战略,并在三年来不断推进数字大脑进化,今年更是推出了专为AIGC打造的集智慧计算、高速交换、智能调度于一体的算力提升解决方案。
加快AIGC相关应用的探索,是新华三迈向自身新发展阶段的关键步伐。2021年,新华三曾提出向千亿企业迈进的长期战略目标,即到“十四五”(2021-2025)末前后实现营收突破千亿大关的目标。
2022年,新华三营业收入达到498.10亿元,同比增长12.31%;实现净利润37.31亿元,同比增长8.65%。
在2023领航者峰会上,紫光股份董事长、新华三集团总裁兼CEO于英涛表示:“新华三到2025年实现1000亿营收的目标,保持不变。”
2023年是关键一年,除了已到战略规划中期,在今年,新华三亦将完成股权变更。
1月,紫光股份(SZ:000938)发布《重大事项进展公告》称,HPE(Hewlett Packard Enterprise)实体向紫光股份旗下全资子公司紫光国际信息技术有限公司(下称紫光国际)发出了《关于行使卖出期权的通知》,将向紫光国际出售其持有的新华三49%的股权。
5月26日晚间,紫光股份公告称,拟定增120亿元,以定价总额246.85亿元收购新华三剩余49%股权。股权交割完成后,紫光国际将实现对新华三100%持股。业界认为,新华三成为紫光国际的全资子公司后,与紫光股份在产研、销售、服务、供应链等环节可以实现互补,新华三就此进入新周期。
4月28日,紫光股份发布2023年第一季度财报,该公司收入和净利润持续增长,营业收入达165.29亿元,同比增长7.74%;归属于上市公司股东的净利润为4.39亿元,同比增长17.92%。其中,其控股子公司新华三实现营业收入106.42亿元,净利润6.96亿元,贡献了紫光股份超过一半的营收,甚至支持了紫光股份其他业务板块。
于英涛表示,从目前的进展看,新华三2025年前后实现千亿营收的目标,既有挑战,又充满希望。
于英涛表示,新华三将坚持聚焦ICT主航道,以创新为立身之本,持续加大研发投入,基于“云-网-算-存-端”全业务布局,并利用AI赋能全线产品,实现技术和全套解决方案的智能化升级。
同时,实现千亿目标的底气来自开拓新的市场。新华三将持续深耕海外市场,加快打造“第二增长曲线”。目前新华三已在亚洲、欧洲、非洲、拉美等地区设立17个海外分支机构,认证的海外合作伙伴超过1500家,在37个国家和地区建立了备件库,服务可覆盖176个国家及地区,及时、高效地为全球客户提供本地化销售及服务。今年2月,新华三已在印尼巴厘岛举办了首场国际峰会。
于英涛表示,未来在海外业务的发展上,新华三制定了全新的海外战略:围绕生态系统、人才赋能和技术创新三方面,通过构建本地化ICT生态、打造本地化ICT技术人才体系、因地制宜落地“协同办公”“创新教育”“智能制造”“高效医疗”“可靠的公共服务”五大场景化解决方案,助力海外国家及地区实现数字化转型的“本地化”。