集微网消息,凭借惊艳的表现,ChatGPT今年迅速成为顶流,并引发了“千模大战”,AI产业也迎来“iPhone时刻”。而AI的爆发式增长,也将驱动算力、网络设备和光模块等领域的极大发展。
AIGC高光之下,光模块乘风而上?
大模型时代催生高算力需求。据OpenAI测算,自2012年以来,全球头部AI模型训练算力需求3-4个月翻一番,每年头部训练模型所需算力增长幅度高达10倍。当下,人工智能大模型所需算力增长速度,已远超摩尔定律。AIGC推动着算力强劲需求同时,也催生了更大的宽带需求。
(来源:博主Amir Gholami)
算力需求的爆发也成为光模块市场的主要推动力之一。
光模块是用于通信设备之间数据传输的光电子器件,主要作用是进行光电和电光转换。电信市场是光模块的“发源地”,光模块是另一个主要应用市场即以谷歌、微软、亚马逊等云服务厂商为主的数通市场。
从电信网络传输需求来看,5G传输网络由前传、中传和回传组成。前传层面,由于设备数量多,所用光模块速率较低,但数量最大;中传和回传,网络结构比较精简,但数据流量大,因此所用光模块速率较高,但数量相对较少。前传主要为10G、25G光收发模块,中传主要为50G、100G、200G光收发模块,回传主要为100G、200G、400G光收发模块。
ChatGPT掀起AI浪潮之前,数通市场已为光模块主要市场。随着ChatGPT引爆AI算力时代,大模型风起,参数量由千亿达到万亿,算力需求大幅增加。AI成为光模块的主要拉动力,并带动800G等高速光模块的需求。业内认为,800G光模块量产窗口已至,2024年或成800G大年。
光模块在数通市场的发展,一部分得益于数据中心网络架构的变化,其由传统的三层结构转向新型的叶脊结构,每台脊交换机都与所有叶交换机相连,数据传输可以动态选择多条路径,可缓解宽带压力,提高数据传输效率。叶脊网络架构下连接端口数增加,光模块需求量随之增加。此外,叶脊网络架构还提升了内部设备的连接密度、接口速率及交换容量,因此将推动光模块产品向高速率方向更新迭代。
光模块与GPU的强绑定关系已不言而喻,因此业界也流传着“英伟达吃肉,光模块喝汤”的说法,“数字”或许是两者绑定关系的最好说明。
据中国计算机互连技术联盟(CCITA)CPO 标准及草根调研数据,云计算通用服务器所属叶脊架构的交叉互联网络中上行、下行端口收敛比约为3:1,1台服务器约需要4-6个光模块。
英伟达是全球算力领军和标杆,A100、H100已是AI GPU的“代表”,今年5月,英伟达正式发布了全新的GH200 Grace Hopper超级芯片,以及基于NVIDIA NVLink Switch System驱动的拥有256个GH200超级芯片的NVIDIA DGX GH200超级计算机,旨在助力开发面向生成式AI语言应用、推荐系统和数据分析工作负载的巨型、下一代模型。
据悉,英伟达超级计算机DGX GH200的推出,也带来单GPU与800G光模块配比量数倍增加。
对于GPU与光模块的“配比”,不同分析机构进行了测算。例如,AI服务器所用的A100、H100等GPU,需用200G以上的高速率光模块8-10个/片;每颗GH200芯片或需要12个800G光模块;800G光模块:A100GPU约为1.25:1,800G光模块:H100GPU约为2.5:1。
薄膜铌酸锂借势破局有望?
在光模块的“进阶”路线中,更小型化、更高速率、更低成本是必然方向,除CPO 被视为长期路径、LPO被视为短中期过渡方案外,铌酸锂薄膜技术及其潜在的集成光子学系统,已逐渐成为当前光子学研究前沿的“变革性”技术。
作为光模块中的核心器件,电光调制器通过调制将通信设备中的高速电子信号转化为光信号。目前光调制的技术主要基于硅光、磷化铟和铌酸锂三种材料平台的电光调制器。其中,铌酸锂有高带宽、低插损、较高消光比等优点,主要用在100Gbps以上的长距骨干网相干通讯和单波100/200Gbps的超高速数据中心中;但也存在着尺寸较大、难以满足光器件小型化趋势、成本较高等问题。
通过新工艺制备的薄膜铌酸锂调制器不仅继承了铌酸锂材料的性能优势,在体积、成本等方面也有所改善,在保留铌酸锂调制器原有性能优势的同时尺寸显著变小,带宽也进一步突破,有望成为电光调制器未来的重要发展方向。随着全球高速相干光调制器出货量的增加,如薄膜铌酸锂调制器体渗透率进一步提升,对应市场空间广阔。
有产业人士认为,为了满足人工智能对算力服务器的要求,光模块需要800G以上甚至到1.6T的传输速率上,将带动光模块相关技术路线的前瞻性研发和迭代升级,薄膜铌酸锂方案有望借势破局。