中国基金报记者 文夕
当算力成为AI时代刚需,GPU服务器需求应声而起。
在4月6日的业绩会上,通信巨头中兴通讯对外界关注在AI领域布局,尤其是芯片自研等热点话题与投资者、券商等进行交流。该公司内部研判ChatGPT是AI技术重大跨越式突破,同时宣布,计划在今年底推出支持大带宽的ChatGPT的GPU服务器。
这一官宣消息也令股价大振。7日早间,中兴通讯股价一度冲击涨停。截至午盘收盘,这家市值超1700亿巨头股价涨幅达9.75%。
自研AI加速芯片
中兴通讯总裁徐子阳在会上直言,语言大模型这种通用性和有限能力催生了ChatGPT爆发,比原本预估的要快得多,“我们认为它会引发一次新的工业革命,我们对它再重视都不为过,推动整个信息社会向智能化社会进行演进,我们隐约感觉到它可以改变人的生活方式,大幅度提高生产效率。”
据他透露,中兴通讯内部研判ChatGPT是人工智能技术重大跨越式突破,公司已经结合自身优势开始重点投入。
徐子阳表示,中兴通讯将围绕基础大模型,利用公司先进的数字底座的能力做布局。第一,支持客户在该领域的培训,核心问题是要降低大模型的部署成本和能耗。第二,利用中兴通讯自身技术优势研究语言大模型,提升自身和客户研发效率。
“今年年底会发布支持大模型训练包括AI服务器、高性能的交换机和GPU等,我相信除了算力强,互联带宽也得足够。”徐子阳还表示,在软件层面会把公司这些能力加入到整个数字信息的解决方案中。
中兴通讯方面还在会上透露,将会自研AI加速芯片,降低整个推理成本,希望跟行业一起把大模型的想法落实到关键生产能力中。在此之前,中兴通讯和百度联合宣布,中兴通讯服务器将支持百度“文心一言”,为AI产品应用提供更加强劲的算力支撑。
据IDC数据显示,2022年第四季度中国服务器市场跟踪报告,服务器厂商中,浪潮、戴尔、联想份额均出现下滑,超聚变和中兴则取得明显增长,其中中兴通讯市场份额从3.1%提升至5.3%,位居国内第五。中兴通讯年报显示,其2022年服务器收入已达100.08亿元,同比增长近80%。
算力拉动服务器需求
实际上,在AI时代,算力毫无疑问将成为刚需。Open AI此前预计,人工智能科学研究要想取得突破,所需要消耗的计算资源每3-4个月就要翻一倍,资金也需要通过指数级增长获得匹配。
在算力方面,GPT-3.5在微软Azure AI超算基础设施(由V100GPU组成的高带宽集群)上进行训练,总算力消耗约3640PF-days(即每秒一千万亿次计算,运行3640天)。在大数据方面,GPT-2用于训练的数据取自于Reddit上高赞的文章,数据集共有约800万篇文章,累计体积约40G;GPT-3模型的神经网络是在超过45TB的文本上进行训练的,数据相当于整个维基百科英文版的160倍。
市场普遍预计,随着ChatGPT和AI的发展,会加速数据中心建设,同时拉动服务器的采购。据Digitimes Research预测,2023年全球服务器出货量有望增长5.2%,增长动力来源于全球数据中心建设的加速。IDC也预测,到2025年全球AI服务器市场规模将达317.9亿美元,年复合增长率为19%。
目前,GPU服务器市场上的主要厂商包括英伟达、AMD、英特尔等。其中,英伟达是GPU服务器市场的领导者,其GPU服务器市场份额占据了80%以上,而AMD则在市场份额方面表现出了快速增长的趋势。
在国内方面,在2021年,GPU服务器以91.9%的份额占国内加速服务器市场的主导地位;NPU、ASIC和FPGA等非GPU 加速服务器占比8.1%。IDC预计GPU服务器市场到2026年将达到103.4亿美元规模,年复合增长率为19%,占全球整体服务器市场近三成。
近年来,国内的GPU服务器厂家,如浪潮、用友等也在逐渐崭露头角。
GPU芯片亟待突破
不过,对于GPU服务器而言,GPU芯片是绕不过的坎。
一般而言,AI服务器通常选用CPU与加速芯片组合来满足高算力要求,常用的加速芯片有GPU、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、神经拟态芯片(NPU)等。而GPU凭借其强大的并行运算能力、深度学习能力、极强的通用性和成熟的软件生态,成为数据中心加速的首选,90%左右的AI服务器采用GPU作为加速芯片。
目前GPU市场主要由英伟达和AMD两家所占据。近些年,国外GPU技术快速发展,已经大大超出了其传统功能的范畴。根据天数智芯数据,2021年英伟达在中国云端AI训练芯片市场的份额达到90%。IDC数据显示,2021年,中国加速卡出货量超过80万片,其中英伟达占据超过80%市场份额。
值得注意的是,从当前来看,英伟达的A100、H100系列和AMD的MI250系列及未来的高端GPU产品,是否可以售卖给中国客户,需要获得美国政府的许可。上述芯片均为用于通用计算的高端GPGPU(通用图形处理器),通常应用在人工智能计算的云端训练和推理场景和超级计算机中,在国内的客户多为云计算厂商及高校和科研院所。
在市场看来,短期来看可以选择英伟达和AMD的还没有被禁止的中低性能GPU芯片。对于云端计算,短期内可以通过使用多个算力较低的CPU、GPU和ASIC芯片来复制高端GPU芯片的处理能力,基本可以满足云端训练和高性能计算的要求。
不过,国内厂商基本上也各自选择了不同方向进行突破,小部分厂商同时进行两个方向的技术布局。GPGPU方向的代表性厂商像海光信息、壁例、沐曦、登临、天数智芯等,渲染路线的代表性商像景嘉微、摩尔线程、芯动科技等。
但华金证券认为,国产GPU厂商真正的大量出现是最近几年的事情,从当前来看,大量企业属于初创期,无论是产品能力还是市场规模都无法和国外大厂相提并论。但该机构也认为,国内广商当下是从0到1的阶段,先求有产品,能够通过产品逐步打开一定的市场,再求快速迭代,拉近与国外大厂的差距,并形成自身的竞争力。
中信证券一份研报显示,国内CPU/GPU/DPU领域大多厂商还只是规划向5nm迈进,大多数节点还在16nm或10nm之上,真正实现5nm芯片量产的较少。设计一颗28nm芯片成本约5000万美元,而7nm芯片需要3亿美元,5nm则需要5.42亿美元。
编辑:舰长
审核:木鱼
版权声明
《中国基金报》对本平台所刊载的原创内容享有著作权,未经授权禁止转载,否则将追究法律责任。