「20 年前我们推出了 RTX 显卡,5 年前我们将图形计算与 AI 结合,推出了「星战」Demo。」
美国当地时间 8 月 8 日早上,英伟达创始人、CEO 黄仁勋在世界计算机图形会议 SIGGRAPH2023 上,开场回顾了英伟达在图形计算上的高光时刻,并且展示了最新的实时渲染的 4K 分辨率的 3D 赛车追逐 Demo。
不过,仅仅几分钟后,「皮衣教主」的演讲,就从 3D 图形完全过渡到 AI 上了。作为人工智能浪潮中最重要的人物,黄仁勋为「普及生成式 AI」提供了更生猛的硬件,和更智能的应用和平台。
当天,黄仁勋曝光了用于生成式 AI 的 GH200 Grace Hopper 超级芯片、NVIDIA AI Workbench 以及通过生成式 AI 和 OpenUSD 升级的 NVIDIA Omniverse。
同时,黄仁勋还宣布英伟达与 AI 开源社区 Hugging Face 合作,将把生成式 AI 超级计算能力交付给数百万开发者,为他们构建大型语言模型(LLM)和 AI 应用提供支持。
「还是那句话,买的越多,省的越多。」即使到了现在,黄仁勋依然不改金牌销售的风格。
「核弹工厂」,即将上线
「生成式 AI 时代的来临,就像 iPhone 时刻一样。」黄仁勋感概,英伟达加速计算的旅程与深度学习研究人员的旅程相遇,现代人工智能的大爆炸发生了。
五年前,英伟达通过在 GPU 上引入 AI 和实时光线追踪,重新定义了图形技术。但是「当我们通过 AI 重新定义计算机图形时,我们也正在为 AI 重新定义 GPU」。
结果就是,出现了越来越强大的系统,例如 NVIDIA HGX H100,利用八个 GPU,总计 1 万亿个晶体管,比基于 CPU 的系统提供了显著的加速。
黄仁勋展示 GH200 芯片|英伟达
五年后,为了继续推动 AI 发展,英伟达推出了 Grace Hopper 超级芯片,即 NVIDIA GH200,它将 72 核 Grace CPU 与 Hopper GPU 相结合,提供 1 EFLOPS 的 AI 算力和 144TB 的高速存储,并于今年 5 月全面投产。
对于 GH200,黄仁勋在演讲又拿出了看家金句,「如果我可以请你记住我今天演讲中的一件事,那就是,未来属于加速计算,你买的越多,你省的越多」。
NVIDIA GH200 最可怕的不是性能强悍,而是近乎疯狂的「可扩展性」。
GH200 Grace Hopper 超级芯片平台。该平台连接多个 GPU,用于处理复杂的生成式工作负载,包括大型语言模型、推荐系统和矢量数据库。据称,与前一代相比,双配置的内存容量是之前的 3.5 倍,带宽是之前的 3 倍,服务器配备 144 个 Arm Neoverse 核心、8 petaflops 的 AI 性能和 282GB 的最新 HBM3e 内存技术。预计 2024 年第二季度将有客户基于该平台推出自己的系统。
GH200 组成的 AI 超算实体大小图|英伟达
根据老黄的说法,在相同的成本(1 亿美元)下,2500 块 GH200 组成的计算中心,在 AI 计算的能效上,要比传统的 CPU 计算中心高 20 倍。
如果说上千块 GH200 适用的对象是「前沿大语言模型」,对于已经成为「主流」的模型,英伟达也提供了能被普通人和公司使用的、成本更低的产品。
基于专业图形应用需求,如计算机辅助设计和数字内容创作,英伟达还发布了基于 Ada Lovelace 架构的 RTX 4000 20GB、RTX 4500 24GB 和 RTX 5000 32GB,分别能提供 26.7、39.6、65.3 FP32 TFLOPS 的计算性能。
英伟达推出搭载 L40S GPU 的 OVX 服务器产品|英伟达
此外,英伟达还推出了搭载 L40S GPU 的 OVX 服务器产品,每台服务器最多可以装八个 L40S GPU,每个 GPU 有 48GB 内存。对于具有数十亿参数和多种数据模态的复杂 AI 工作负载,相较于 A100 Tensor Core GPU,L40S 能够实现 1.2 倍的生成式 AI 推理性能和 1.7 倍的训练性能。
「专为生成式 AI 时代打造的 AI 超算」,GH200 的 PPT 页面上如此写道。
联手开源,「普惠生成 AI」
为了加速各类企业定制生成式 AI,黄仁勋宣布,英伟达推出「AI Workbench」。
据称,它为开发人员提供了一个统一、易于使用的工具包,可以在个人电脑或工作站上快速创建、测试和微调生成式 AI 模型,然后将其扩展到几乎任何数据中心、公有云或 NVIDIA DGX Cloud。
AI Workbench 主要降低企业启动 AI 项目的门槛。通过在本地系统上运行的简化访问界面,它允许开发人员从流行库(如 Hugging Face、GitHub 和 NGC)中微调模型,使用自定义数据。然后,这些模型可以在多个平台之间共享。
黄仁勋介绍英伟达 AI Workbench|英伟达
全球各地企业都在竞相寻找合适的基础架构并构建生成式 AI 模型和应用,尽管现在已经有数以千计的预训练模型可用,但是使用许多开源工具进行定制可能仍具挑战性且耗时。
「为了使这种能力普惠,我们必须使其能够在几乎所有地方运行。」黄仁勋称,「让所有人都能参与生成式 AI。」
借助 AI Workbench,开发人员可以只需点击几下就可以定制和运行生成式 AI。它允许他们将所有必要的企业级模型、框架、软件开发工具包和库汇集到一个统一的开发者工作区中。
据称,包括戴尔、惠普、Lambda、联想和 Supermicro,都正采用 AI Workbench,因为它可以将企业生成式 AI 能力带到开发人员希望工作的任何地方,包括本地设备。
在演讲中,黄仁勋展示了 AI Workbench 和 ChatUSD 如何将所有这些功能结合在一起:允许用户从 GeForce RTX 4090 笔记本电脑启动项目,并随着项目变得更加复杂而无缝扩展到工作站或数据中心。
据黄仁勋展示,用户可以提示模型生成一张玩具黄仁勋在太空中的图片,但初始模型提供的结果不适用,因为它从未见过玩具黄仁勋,这时候用户可以用八张玩具黄仁勋的图片微调模型,然后再次输入提示,获得正确的结果。
使用提示词创建出的黄仁勋人偶上太空|英伟达
然后,使用 AI Workbench,新模型就可以部署到企业应用程序中。
黄仁勋还宣布了英伟达与 Hugging Face 的合作伙伴关系,后者拥有 200 万用户,或将使英伟达的生成式 AI 计算能力成为数百万开发人员构建大型语言模型和 AI 应用的工具。
作为合作的一部分,Hugging Face 将提供一个新的服务——「训练集群即服务」(Training Cluster as a Service),由 NVIDIA DGX Cloud 提供支持,该服务将在未来几个月内推出。
开发人员将能够在 Hugging Face 平台内访问 NVIDIA DGX Cloud AI 超级计算,以训练和微调先进的 AI 模型。据悉,Hugging Face 社区已分享超过 25 万个模型和 5 万个数据集。
「这将是一个全新的服务,将世界上最大的 AI 社区与世界上最好的训练和基础设施连接起来。」黄仁勋称。
ChatUSD,对话式「3D 生成」
就在本周,英伟达、苹果、Adobe 和 Autodesk 等公司联手成立 OpenUSD 联盟,将这个诞生于皮克斯的 3D 标准,推向更广阔的世界。
而将 OpenUSD、AI 以及 Omniverse 结合,设计和开发人员将能通过 ChatUSD 这样的对话式界面,直接用自然语言修改和创建 3D 环境及物体,极大简化 3D 制作流程。
黄仁勋介绍 OpenUSD 联盟|英伟达
该联盟将标准化并扩展 OpenUSD,这是开源的通用场景描述框架,是实现互操作性的 3D 应用程序和项目的基础,涵盖从视觉效果到工业数字孪生的各个领域,如连接电影和动画流程,创建真实精确的实时数字工厂、仓库、城市甚至地球数字副本等。
英伟达和 Adobe 还计划将 Adobe Firefly(Adobe 的创意生成式 AI 模型系列)作为 API 提供在 Omniverse 中。
据悉,Cesium、Convai、Move AI、SideFX Houdini 和 Wonder Dynamics 等 AI 工具现在已经通过 OpenUSD 连接到 Omniverse。
使用 OpenUSD,各个管线的工具可以同时使用一个素材和场景|英伟达
例如,Wonder Dynamics 通过新的 OpenUSD 导出支持,可以自动将计算机生成的角色动画、灯光和合成到现实场景中。Move AI 可以使用 Move One 应用程序进行单摄像机运动捕捉,可以生成 3D 角色动画,然后可以导出到 OpenUSD 并在 Omniverse 中使用。
现在,Omniverse 用户可以构建与其他基于 OpenUSD 的空间计算平台(如 ARKit 和 RealityKit)兼容的内容、体验和应用程序。
另外,黄仁勋还宣布了由英伟达构建的四个新的 Omniverse Cloud API,包括 ChatUSD、RunUSD、DeepSearch 和 USD-GDN Publisher,供开发人员更无缝地实现和部署 OpenUSD 管道和应用程序。
使用 ChatUSD,可以用自然语言修改右边的 3D 模型|英伟达
其中,ChatUSD 可以回答 USD 知识问题或生成 Python-USD 代码脚本;RunUSD 可以将 USD 文件转化为渲染图像;DeepSearch 可以实现语义 3D 搜索;USD-GDN Publisher 可用于发布基于 OpenUSD 的高保真体验,实时流式传输到 Web 浏览器和移动设备。
英伟达 Omniverse 和模拟技术副总裁称,「工业企业正在竞相将其工作流数字化,这增加了对启用 OpenUSD 的、连接的、可互操作的 3D 软件生态系统的需求。」「最新的 Omniverse 升级让开发人员通过 OpenUSD 利用生成式人工智能来增强他们的工具,同时允许企业构建更大、更复杂的全球规模模拟,作为其工业应用的数字测试场。」
目前都有谁在用 Omniverse?据黄仁勋介绍,科技公司正在用它测试和模拟协作机器人,亚马逊用它模拟车队将仓库数字化,汽车厂商如梅赛德斯用它来模拟自动驾驶汽车,宝马用它模拟新的电动汽车生产线,将全球工厂网络数字化,Deutsche Mind 用它创建铁路网络的数字孪生,甚至还有公司用它创建地球的数字孪生,即地球的气候系统等等。
据悉,英伟达还正在开发一种新的 SimReady 3D 模型结构。这些模型将包括真实的材料和物理属性,这对于准确训练自主机器人和车辆至关重要。例如,一个负责分拣包裹的自主机器人需要在 3D 模拟中进行训练,这些包裹在物理接触时移动和反应,就像在现实世界中一样。
在 AI 的推动下,协作式 3D 和工业数字化的时代正在到来。黄仁勋还认为,未来的工厂将是机器人工厂,「机器人协调一大堆机器人来制造本身就是机器人的汽车」「我们希望 AI 能够进行自我编程」。
「未来,整个工厂将由软件定义。」黄仁勋称。
作为这一波「生成式 AI」浪潮中最重要的「基建」公司,英伟达股票已经在最近暴涨 200%,一度突破万亿美元大关。
而在售卖「核弹」硬件之外,在软件、云计算和平台以及生态方面,英伟达同样不遗余力,因为只有让生成式 AI 真正进入到工业生产和办公中,才算是真正实现「AI 普惠」。而从这个角度来看,英伟达和现在的 AI 初创公司,以及正在向生成式 AI 转型的传统公司,其实在一条船上。
「买更多,省更多」,而只有「更多 AI」,英伟达才能保证自己「越赚越多」。
WINTEC亿胜盈科 2024-12-19