黄仁勋的深夜秀带来超强生成式AI处理器，AIGC迎来iPhone时刻

作者：亿欧发布时间：2023-08-10

随着ChatGPT以前所未有的速度火出圈，大模型也迅速从过去的遥不可及走到了我们身边。从今天开始，元碳院将开始解读大模型，依旧保持硬核且专业。今天是第三十期，爆炸级的产品，惊人的技术实力，高瞻远瞩的目光，黄仁勋和英伟达再次给世界带来了“亿点点”震撼。

美国西部时间8月8日早晨，北京时间8日晚间，NVIDIA（英伟达）创始人兼CEO，“皮衣教主”黄仁勋在加州洛杉矶举办的“2023年世界电脑图形会议”（SIGGRAPH 2023）上，穿着自己那标志性的皮衣，开场先回顾了英伟达历史上的高光时刻，“20年前我们推出了RTX显卡，5年前我们将图形计算与AI结合，推出了《星战》Demo。”

仅仅几分钟后，黄仁勋的演讲就从3D图形过渡到AI上了。作为AI 2.0浪潮中极具存在感的人物，黄仁勋为普及生成式AI提供了一系列堪称“生猛”的硬件，以及非常智能的应用和平台。当天的表演现场，黄仁勋又带来了新货：用于生成式AI的GH200 Grace Hopper超级芯片、NVIDIA AI Workbench、以及通过生成式AI和OpenUSD升级的NVIDIA Omniverse。同时，黄仁勋还宣布英伟达与世界顶级AI开源社区Hugging Face展开合作，将把生成式AI必备的超级计算能力交付给全球数百万开发者，为他们构建大模型和AI应用提供支持。

在演讲的同时，黄仁勋依然坚持自己金牌销售的本色：“还是那句话，买的越多，省的越多。”

最强AI超算更上一层楼，“核弹工厂”即将上线

发布会上，黄仁勋感慨“生成式AI时代的来临，就像十几年前的iPhone时刻一样。”在五年前的SIGGRAPH上，英伟达通过将AI和实时光线追踪技术引入GPU，重新定义了电脑图形学。五年后的黄仁勋表示：“当我们通过AI重新定义电脑图形学时，我们也在为AI重新定义GPU。”结果就是二者的“双向奔赴”催生了越来越强大的系统，例如NVIDIA HGX H100，利用八个GPU，总计一万亿个晶体管，提供的加速计算能力比基于CPU的系统更显著。

五年已经过去，为了继续推动AI的发展，英伟达这次带来了Grace Hopper超级芯片，即NVIDIA GH200，将72核的Grace CPU与Hopper GPU相结合，提供一亿次每秒浮点运算(FLOPS)的强大算力和最大144TB的高速存储，在全球最快内存HBM3e的辅助下，内存容量高达141GB，还有每秒5TB的带宽。其单个GPU的容量就已达到H100 GPU的1.7倍，带宽达到H100的1.55倍，并已于今年五月全面投产。

如果你以为新款芯片仅仅是性能强大那显然是管中窥豹，以偏概全了。它真正值得称道的是可扩展性，用“夸张到疯狂”形容都不过分。GH200 Grace Hopper超级芯片作为平台，同时连接多个GPU，用于处理复杂的生成式工作负载，包括大模型、推荐系统和矢量数据库。据黄仁勋介绍，与前代相比，新产品配置的内存容量是之前的3.5倍，带宽是之前的3倍，服务器配备144个Arm Neoverse核心和高达282GB的最新HBM3e内存技术，AI性能支持每秒进行八千万亿次的数学运算。同时黄仁勋也预计，明年第二季度将有客户基于该平台推出自己的系统。

GH200 Grace Hopper超级芯片的实体图，中间黑影即黄仁勋

黄仁勋在现场抛出一个问题：“花一亿美元能买什么？”随后他自问自答的表示，过去一亿美元能买8800块x86 CPU组成的数据中心，功耗大约是5MW。现在一亿美元能买2500块GH200组成的Iso-Budget数据中心，功耗大约是3MW，而AI推理性能达到之前系统的12倍，能效则是20倍。如果要与x86 CPU数据中心的AI推理性能看齐，Iso-Troughput数据中心只需用到210块GH200，功耗约0.26MW，成本约800万美元，还不到CPU数据中心的10%。

至此就可以明白了为什么黄仁勋一再强调“买的越多，省的越多”。

刀法精准，四款显卡齐上新

与GH200 Grace Hopper超级芯片同步上新的还有桌面AI工作站GPU系列，而且是一口气推出四款新品：RTX 4000、RTX 4500、RTX 5000和RTX 6000。与GH200那种展示英伟达GPU技术和性能天花板的产品不同，这四款就是针对桌面和数据中心推出的，特别是成本预算有限的客户。

毋庸置疑的，作为旗舰级专业显卡，RTX 6000的性能参数是四款中的最强者。凭借着48GB的显存，18176个CUDA核心，568个Tensor核心，142个RT核心，和高达960GB/s的带宽，它的表现在四者里堪称一骑绝尘。以此为基准逐步降低的，RTX 5000配备了32GB显存，12800个CUDA核心，400个Tensor核心，100个RT核心。RTX 4500配备了24GB显存，7680个CUDA核心，240个Tensor核心，60个RT核心。RTX 4000配备了20GB显存，6144个CUDA核心，192个Tensor核心，48个RT核心。

所有四款新品均采用4nm定制工艺，支持错误代码纠正，适用于大型3D模型、渲染图像、模拟和AI数据集的无误差计算。同时还支持高分辨率XR设备，以提供创造AR、VR和MR内容所需的高性能图形。

同时基于此四款新品，黄仁勋还针对企业级客户准备了一套一站式解决方案--RTX Workstation，支持最多4张RTX 6000并联，可以在15小时内完成8.6亿token的GPT3-40B的微调任务，还能让Stable Diffusion XL每分钟生成40张图片，比之前的RTX 4090快五倍。该工作站系统将于秋季开始提供。

刀法精准，四款显卡齐上新

除了这些炸裂级硬件产品外，黄仁勋还公布了三则关于英伟达与优化生成式AI的消息，这些将有助于加速行业采用基于LLM的生成式AI：1.英伟达和全球最大AI开源社区Hugging Face建立合作；2.推出NVIDIA AI Enterprise 4.0系统，把DGX Cloud中的所有功能集成到英伟达AI Enterprise软件中；3.推出NVIDIA AI Workbench，将需要用于生成式AI工作的一切都打包在一起，只用点击一下就能将这个项目移动到任何设备终端或云端。下面分开来说。

01与Hugging Face合作：将全球数百万开发人员连接到生成式AI超级计算平台上。

黄仁勋宣布，英伟达和Hugging Face建立合作伙伴关系，将为构建大模型和其他AI应用程序的开发人员提供生成式AI所需的超级算力。开发者可以访问Hugging Face平台内的NVIDIA DGX Cloud AI超级计算平台，来训练和微调自己的大模型。DGX Cloud的每个实例有八个NVIDIA H100或A100 80GB Tensor Core GPU，每个节点的GPU内存总计640GB。作为合作的一部分，Hugging Face将推出一项名为“训练集群即服务”的业务支出，以简化企业创建新的和自定义生成式大模型的流程。该服务由NVIDIA DGX Cloud提供支持，将在未来几个月内推出。

02NVIDIA AI Workbench：在笔记本电脑上也能轻松启动生成式AI项目

这是个统一、易用的工作空间，能让开发者随处构建或运行自己的大模型。开发者可以很方便地将所有必要的模型、框架、数据库和SDK等素材，从开源代码库和NVIDIA AI平台打包到这个统一的开发者工作空间中，然后只需点击鼠标，就能将自己的大模型从一个位置移动到另一个位置。这样就能在PC、笔记本或工作站上快速创建、测试和定制预训练的大模型，并在需要时将其扩展到数据中心、公有云或NVIDIA DGX Cloud。举个例子，你可以在NVIDIA AI Workbench页面上导入项目，比如导入SDXL-dev文生图模型，输入“黄仁勋在太空”，结果因为模型似乎不认识老黄，生成的图像跟老黄的形象不能说完全一致，起码也是离的挺远，皮衣倒是一脉相承。

03NVIDIA AI enterprise 4.0：提供一系列生成式AI工具最新版的企业软件平台

AI enterprise 4.0可提供生产就绪型生成式AI工具，并保证可靠的生产部署所需的安全性和API稳定性。AI Enterprise 4.0支持的软件和工具有助于简化生成式AI部署，其中一大亮点是引入用于构建、定制和部署大模型的云原生框架NVIDIA NeMo。其他工具还包括NVIDIA Triton管理服务，通过模型编排实现可扩展AI高效运行；NVIDIA Base Command Manager Essentials集群管理软件，帮助企业在数据中心、多云和混合云环境中最大限度提高AI服务器性能和利用率等。AI Enterprise软件支持用户跨云、数据中心和边缘构建和运行支持NVIDIA AI的解决方案，经认证可在主流NVIDIA认证系统、NVIDIA DGX系统、所有主要云平台和新发布的NVIDIA RTX上运行工作站。最新版本的企业软件平台将集成到谷歌云、微软Azure、Oracle云基础设施等NVIDIA合作伙伴市场。

从OpenUSD到ChatUSD，以及通过对话生成3D内容

本周，英伟达与苹果、Adobe和Autodesk等企业联手成立OpenUSD联盟，正在努力将它推向更广阔的世界。OpenUSD（Universal Scene Deion）提供了一个开源、通用的场景描述格式，使不同品牌与类型的3D设计软件可以无障碍的彼此协作。因为英伟达自家的Omnivers就是建立在USD体系之上的，这次Omniverse针对OpenUSD的升级，使Omniverse能为开发者与企业推出了更多的框架和资源服务。

而将OpenUSD、AI以及Omniverse结合，开发者将能通过ChatUSD这样的对话式界面，直接用自然语言修改和创建3D环境及物体，极大简化3D内容的制作流程。OpenUSD将推动标准化进程并逐步扩展，本身也是实现互操作性的3D应用程序和项目的基础，涵盖从视觉效果到工业数字孪生的各个领域，如连接电影和动画流程，创建真实精确的实时数字工厂、仓库、城市甚至是地球的数字副本。

通过OpenUSD，不同的工具可以同时使用同样的素材和场景

在强大AI的推动下，协作式3D和工业数字化的时代正在到来。黄仁勋还表示未来的工厂将是机器人工厂，“机器人协调一大堆机器人来制造本身就是机器人的汽车”，“我们希望AI能够进行自我编程”，“未来，整个工厂将由软件定义。”

在刚刚过去的昨天，英伟达再次用爆炸级的产品，惊人的技术实力，高瞻远瞩的目光，让全世界再次看到它将如何引领全球AI和图形计算的新浪潮。在再次重复经典名言“买的越多，省的越多”后，黄仁勋缓缓走下舞台，却把现场气氛推向了极致。

黄仁勋的深夜秀带来超强生成式AI处理器，AIGC迎来iPhone时刻

推荐体验

相关资讯

英伟达CEO黄仁勋展示了生成式AI 时代而生的处理器

昨夜，黄仁勋甩出最强生成式AI处理器，全球首发HBM3e，比H100还快

黄仁勋甩出最强生成式 AI 处理器；ChatGPT 回答编程问题错误率超过 50%；Go 1.21 发布|极客头条

黄仁勋强推「最划算」生成式AI处理器，预言未来「人人都是程序员」

英伟达黄仁勋：ChatGPT是AI领域的iPhone时刻

近期资讯

长虹电视安装第三方软件的详细步骤与注意事项

Excel数据随机排序方法详解：函数、功能与VBA多种技巧解析

如何将AirPods与安卓手机连接：详细步骤与常见问题解答

详细步骤教你如何在Windows XP系统中恢复出厂设置

了解电脑配置信息的重要性及查看方法详解

轻松上手微信使用指南：聊天、购物与社交的全能平台

如何在手机上创建文件夹，提升使用效率与整洁度

如何在Windows 10中顺利进入安全模式的多种方法解析

调整电脑字体大小，提升阅读舒适度与工作效率的实用技巧

如何正确格式化手机：步骤、注意事项与数据备份技巧详解

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响