在最新的SIGGRAPH的舞台上,NVIDIA老黄宣布了英伟达最新的NVIDIA DGX GH200 Grace Hopper超级芯片平台。老黄表示,这个“庞然大物”专门为AIGC时代打造,搭载了全球最快的内存,不仅带宽每秒5TB,内存容量更是暴增了接近50%来到141GB,号称“任何大语言模型都能运行”。
现场,老黄通过动画的形式为我们展示了如何使用最新的NVLink等技术,将Grace Hopper超级芯片构建起一整套为AIGC打造超级计算机的全过程。首先,由两个DGX GH200 Grace Hopper超级芯片组成双联体,将双联体与BlueField-3 DPU和ConnectX-7网卡组成一个“计算盒”,再通过NVLink将8个这样的“计算盒”连接组成总内存高达4.6TB的DGX构建块,再由这样的构建块合二为一形成新的计算盒,最终扩建成为256 GPU的工作集群Superpod,突出一个英伟达传统艺能——叠。
1:1等比例图(中间黑影为黄仁勋)
他表示,每个Grace Hopper超级芯片上,CPU和GPU之间的连接速度是第五代PCle的7倍,得益于多GPU高速连接能力,双联体DGX GH200性能几乎可以做到零损失,号称“最快内存”的HBM3e(High Bandwidth Memory 3e)能够在更小的空间内提供更高的数据传输速率,再加上NVLink的高速连接能力,能够使这256块GPU“像是一块一样”工作。
不仅如此,这些Superpod之间还能够继续连接,在低时延的Quantum-2 Infiniband平台的帮助下进行扩展。换言之,这就使其能够根据不同需要,构建出不同规模、不同结构的更适应AIGC时代的全新超级计算机。
目前,有消息人士称新的GH200 Grace Hopper超级芯片平台已经正在生产中,将于2024年第二季度上市,届时很可能会再次AIGC行业带来新的发展机遇,不过这对于中国公司而言很可能不是好事。
消息称近日包括百度、字节跳动、腾讯和阿里巴巴在内的多家中国厂商向英伟达下单订购了价值50亿美元的芯片。报道称,这些公司已下单10亿美元,采购约 10 万颗英伟达A800处理器,预计今年内交付。
英伟达A800是英伟达为了规避美国商务部的半导体新规,对标A100 GPU专供中国市场的处理器。除了互联速度不同以外,A800与A100规格几乎完全相同,但对比英伟达最新的GH200而言,无疑是落后的。
英伟达A800参数规格
更令人担忧的是,美国总统拜登也于近日签署了一项关于限制美国在电脑芯片等敏感技术领域对中国进行投资的行政命令,要求企业必须就其在科技领域的在华投资情况向相关部门进行通报,消息称,该项命令将会授权美国财政部长可以禁止或限制美国在三个领域对中国实体的投资,其中就包括半导体和微电子、量子信息技术以及部分人工智能系统。
因此有评论认为,目前中国互联网巨头争相囤积A800芯片,是考虑到华盛顿政府有可能会在将来出台更严格的出口限制措施,甚至连英伟达性能较弱的芯片也会成为目标,因此才早做准备,正如老黄的那句“买得越多,赚得越多”。
但无论如何,面对飞速发展的AIGC行业,如果不想永远跟在后面就必须抓住现在的机会,在生成式AI还未完全成形的时期杀进市场并取得一定成绩,未来才有可能真正与OpenAI等巨头掰掰手腕,不然可能以后连跟在屁股后面“捡漏”都没有机会。如果此时不重金投入,恐怕在此之后只会落后更多,实在是无奈之举。