老黄携「超级GPU」炸场！E级AI超算性能飞升，买越多越划算，

作者：一起学chatGPT一起学ai发布时间：2023-05-30

新智元报道

编辑：编辑部

【新智元导读】英伟达又放大招了，这次直接用超级GPU GH200燃爆了市场。

今日的COMPUTEX大会上，英伟达CEO黄仁勋向全世界宣布——我们已经到达了生成式AI的引爆点。从此，全世界的每个角落，都会有计算需求。股价刚刚暴涨2000亿美元的英伟达，为这一刻早已做好准备。一开场，身着黑皮衣的老黄慷慨激昂地走上舞台，「大家好！We’re back！」随后，便祭出大杀器——「超级GPU」 GH200，并宣布谷歌云、Meta和微软将率先获得GH200。

据称，有超过3500人亲临现场，体验了这个长达2个小时的激情演讲。时隔4年，阔别已久的老黄也是狂飙中文。

「超级芯片」GH200

要说，这次演讲中，重头戏还是在GPU上。毕竟AI的iPhone已经来临。老黄左右手分别端了一个芯片，重磅宣布，「GH200超级芯片」已经全面投产。

这一「超级GPU」使用NVLink-c2c互连技术，将基于ARM节能的GraceCPU和高性能NVIDIA H100 Tensor Core GPU结合在一起，提供了高达900GB/s的总带宽。目前，由GH200加持的系统加入了400多种系统配置。这些系统配置由英伟达最新的CPU、 GPU和DPU架构的不同组合提供动力。其中包括Grace、Hopper、Ada Lovelace和BlueField，这些架构的创建是为了满足对生成式AI不断增长的需求。

此外，老黄还宣布了一个更重磅的：256个GH200组成的超算来了。
超算DGX GH200，今年上市
英伟达表示，全新DGX GH200人工智能超级计算平台，是专为大规模生成式AI的负载而设计。这台由256块Grace Hopper超级芯片组成的超算，将拥有高达1 exaflop的超凡AI性能，以及144TB的共享内存（比上一代DGX A100多了近500倍）。举个例子，在GPT-3训练中，它能比上一代DGX H100集群快2.2倍。此外，这个庞然大物还包含了150英里的光纤和2,000多个风扇。目前，英伟达已经与三大巨头进行了合作，谷歌、 Meta和微软。

由于生成式人工智能的爆炸式增长，微软、谷歌等巨头希望拥有更强大、性能更好的系统。而DGX H200的设计目的是，通过使用英伟达定制的NVLink Switch芯片，绕开InfiniBand和以太网等标准集群连接的局限性，为最大工作负载的大规模可扩展性提供最大的吞吐量。

另外，英伟达表示正在建造自己的大型AI超级计算机NVIDIA Helios，预计在今年上线。它将使用4个与NVIDIA Quantum-2 InfiniBand网络连接的DGX GH200系统，以提高数据吞吐量，以训练大型AI模型。以往的数据中心都非常庞大，而且是基于CPU的，算法的迭代要花很长时间，大部分算法，也都是CPU中心的。而现在，有了Grace Hopper，只需要几天甚至几个小时，就能完成这个过程。简直要把整个行业都革命掉了！

（等等，PaLM的参数不是540B么？）
老黄：买越多，越省钱！

作为现在的扛把子，这样一个重65磅，价值200000美元的H100计算机，是世界上第一个搭载了Transformer Engine，也是目前全世界最昂贵的计算机。

老黄表示，可以说，像这样的产品，你买得越多，就省得越多。

接下来，老黄提到1964年的IBM 360，强调了CPU的重要性。老黄自信地重复表示，「而60年后，我们现在有数据中心。今天，数据中心就是一个计算机。」

正如老黄所说，一种新的计算模式正在被创造。

为什么使用GPU胜过使用CPU？老黄从配置上给出了分析：花费1000万美金成本，你可以建置一个有960颗CPU的数据中心，但这个数据中心要11GWh的功率，处理1X LMM（大语言模型）的数据量。

但一样的钱，你可以建置一个配备有48个GPU的数据中心，但只要3.2GWh的功耗，而且可以处理44X LLM的数据量。

要知道，如此配置已经足够惊人。然而，这还不够。为了获得极致性能，你可以在功耗不变的情况下，把GPU数量直接拉到172个。此时的算力，可以高达CPU数据中心的150倍。当然，预算也提高到了3400万美元。

此外，如果你就只是单纯地想完成手头的工作（1X LLM），老黄也帮你把成本打下来了——只需花40万美金，就能买一个搭载了2个GPU的数据中心，功耗仅0.13GWh。

台下响起一片掌声，老黄又拿出了口头禅「The more you buy，The more you save」，甚至重复了三遍。这背后的策略，究竟是什么？老黄给了一个公式。

MGX：模块化架构
与此同时，老黄还推出了NVIDIA MGXTM，一个供系统制造商快速、低成本地构建100多个服务器变体的参考架构。据称，这个规范可以将开发成本削减多达四分之三，并将开发时间缩短三分之二，仅需要6个月。有了MGX，科技公司可以为他们的服务器优化加速计算的基本系统架构，然后选择自己的GPU，DPU和CPU。MGX还可以很容易地集成到云和企业数据中心。

除了硬件之外，MGX还得到了英伟达完整软件栈的支持，这使得开发者和企业能够构建和加速 AI、 HPC 和其他应用程序。这包括NVIDIA AI Enterprise，NVIDIA AI平台的软件层，其特点是有100多个框架、预训练的模型和开发工具，以加速人工智能和数据科学，为企业人工智能开发和部署提供充分支持。
将AI引入游戏，实时语音聊天的NPC角色来了
这次演讲的亮点，还有全新的定制AI模型代工服务 ——Avatar Cloud Engine (ACE) for Game。现场，老黄右手手持一块RTX 4060 Ti，左手手持一台电脑，展示了运行实时光线追踪的Cyberpunk 2077。在一个充满「赛博朋克」风格的拉面店场景中，玩家按下一个按钮，可以用自己的声音说话，然后店主Jin会进行回答。Jin是一个NPC角色，但他的回答是由生成式AI根据玩家的语音输入实时生成的。Jin还有着逼真的面部动画和声音，与玩家的语气和背景故事相符。

这个逼真人物角色的生成，使用了一个实时人工智能模型渲染工具Nvidia Ace。老黄表示，这个游戏中的角色并没有预先设定。他们有一个典型的任务提供者NPC类型。

但是从视频中，可以看到，虚拟角色的谈话有点生硬，但还不算太糟。
那些没有AI专业知识的人，将被抛弃
40年来，我们创造了PC、互联网、移动、云，现在是人工智能时代。你会创造什么？不管是什么，都要像我们一样追赶它。要奔跑，不要走。要么是你为食物而奔跑，要么就是你任自己逃避，成为食物。

5月27日，黄仁勋在台湾大学发表了毕业典礼演讲。此刻，他正为全世界所瞩目。瞬间变身万亿掌门人，让他的话更有底气。黄仁勋表示，每个公司和个人都应该熟悉人工智能，否则，就有失败的危险。

他强调：敏捷的公司会利用人工智能提高自己的地位，这样的公司不会倒闭。很多人担心，AI会抢走自己的工作，但真正会抢走你饭碗的，掌握了AI技术的人。当时，他在演讲中预言：从各方面来看，AI的兴盛是计算机产业的再生契机。在下个十年，我们的产业将使用新型的AI电脑，取代价值万亿美元的传统电脑。而从今天的演讲中，我们仿佛已经窥见了这种未来的雏形。

近期资讯

Linux Debian安装ClamAV和命令行扫描病毒方法
ClamAV是一个开源的跨平台病毒扫描引擎，用于检测恶意软件、病毒、木马等安全威胁。一、Linux Debian安装ClamAV 在Linux Debian系统上安装ClamAV，你可以按照以下步骤
星如雨落 2024-12-29

2024海外本土电商崛起，中国商家成“抢手货”
2024年，中国商家的全球征程。
刺猬公社 2024-12-29

开发 AI 应用的无敌配方，半小时手搓学英语利器
每个开发者都有很多和 AI 相关的创意，而 Web 技术是把灵感落地的最佳选择之一。Web is all you need！
JaxNext 2024-12-29

她闯入VC圈
产业联手VC。
投资界 2024-12-29

2024，刷新美国药圈融资纪录的创业公司，为何“独爱”这种中国新药｜行业Mapping
竞争刚刚开始。
胡香赟 2024-12-29

《爆肝整理》保姆级系列教程-玩转Charles抓包神器教程(7)-Charles苹果手机手机抓包知否知否？
打榜首先宏哥要拉一下票，希望喜欢宏哥的支持一下，投下你宝贵的6票，投票完成记得抽奖哈，灰常感谢！！！掘金2024年度人气创作者打榜中，快来帮我打榜吧～ activity.juejin.cn/rank
北京_宏哥 2024-12-29

韩国婚育问题迎拐点？结婚人数连续7个月增长，全年生育率有望反弹
近20年来，韩国政府投入了超过379.8万亿韩元（约合人民币1.88万亿元）
时代周报 2024-12-29

《爆肝整理》保姆级系列教程-玩转Charles抓包神器教程(8)-Charles如何进行断点调试
打榜首先宏哥要拉一下票，希望喜欢宏哥的支持一下，投下你宝贵的6票，投票完成记得抽奖哈，灰常感谢！！！掘金2024年度人气创作者打榜中，快来帮我打榜吧～ activity.juejin.cn/rank
北京_宏哥 2024-12-29

欧莱雅加速平价化；耐克学习阿迪达斯复苏计划；瑞幸在香港连开五店｜品牌周报
你消费的品牌，你关心的周报。
贺哲馨 2024-12-29

评论区哭穷，下单就能便宜？
越穷越省钱？
科技狐 2024-12-29

老黄携「超级GPU」炸场！E级AI超算性能飞升，买越多越划算，

新智元报道

【新智元导读】英伟达又放大招了，这次直接用超级GPU GH200燃爆了市场。

推荐体验

相关资讯

老黄携「超级GPU」炸场！E级AI超算性能飞升，买越多越划算，谷歌微软Meta抢先试用

老黄深夜炸场，AIGC进入iPhone时刻，Hugging Face接入最强超算，神秘显卡胜过A100

亚马逊年终王炸！两大自研AI芯片性能飙升，推AI助手硬刚微软，联手老黄造最强超算

老黄深夜炸场，AIGC进入iPhone时刻，神秘显卡胜过A100

英伟达史诗级暴涨后再放大招，推E级AI超算，黄仁勋狂捧生成式AI

近期资讯

Linux Debian安装ClamAV和命令行扫描病毒方法

2024海外本土电商崛起，中国商家成“抢手货”

开发 AI 应用的无敌配方，半小时手搓学英语利器

她闯入VC圈

2024，刷新美国药圈融资纪录的创业公司，为何“独爱”这种中国新药｜行业Mapping

《爆肝整理》保姆级系列教程-玩转Charles抓包神器教程(7)-Charles苹果手机手机抓包知否知否？

韩国婚育问题迎拐点？结婚人数连续7个月增长，全年生育率有望反弹

《爆肝整理》保姆级系列教程-玩转Charles抓包神器教程(8)-Charles如何进行断点调试

欧莱雅加速平价化；耐克学习阿迪达斯复苏计划；瑞幸在香港连开五店｜品牌周报

评论区哭穷，下单就能便宜？

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响