英伟达再现AI「iPhone时刻」，CEO称生成式AI正颠覆全球企业

作者：ChinaIT.com发布时间：2023-03-23

生成式AI

在为AI浪潮下的企业提供解法的同时，不甘缺席技术浪潮的英伟达或许也在寻找自己的解法。

文｜周鑫雨

编辑｜苏建勋

封面来源｜视觉中国

（ChinaIT.com讯）北京时间2023年3月21日深夜，英伟达创始人兼CEO黄仁勋在2023 GPU技术大会(2023 GTC)上发表演讲。

若2021 GTC的重心还是车，那么从去年开始，AI和碳中和就成了英伟达GTC绝对的主角。

在今年GTC的官方预告中，黄仁勋表示：“AI 正迎来有史以来最辉煌的时刻。新的 AI 技术和迅速蔓延的应用正在改变科学和各行各业，并为成千上万的新公司开辟新的疆域。这将是我们迄今为止最重要的一次 GTC。”

在演讲中，黄仁勋首先分享了英伟达数据中心以及全栈加速计算平台CUDA的新进展——在黄仁勋看来，加速计算是减少功耗、实现可持续发展和排放清零的最好方式。

今年，英伟达对100个加速库和AI模型进行了更新，并开辟了新的应用场景。比如在汽车和航空航天行业，CFD（计算流体力学）被应用于气流的仿真。使用CUDA对CFD求解器进行加速后，英伟达A100芯片的吞吐量是同等系统成本下CPU服务器的9倍。

其次，英伟达推出了与以色列量子计算公司Quantum Machines合作开发的一款量子控制链路。这一链路可将英伟达GPU接入量子计算机，并以极快的速度实现纠错。

与此同时，英伟达在今年将推出新的向量数据库：RAFT。向量数据库的重要作用是为推荐系统提供存储、索引、搜索和检索非结构化数据的大型数据集。RAFT在此基础上，还具有加速索引、数据加载和近邻检索等功能。黄仁勋认为：“对于自研大型语言模型的组织而言，向量数据库至关重要。”

针对深度学习推理平台（NVIDIA Deep Learning AI），英伟达则发布了一系列新功能：支持集成模型的模型分析器、并发多模型服务，以及适用于GPT-3大模型的多GPU、多节点推理。

随着算法的复杂化，计算光刻技术也在快速演进。在演讲中，黄仁勋宣布推出计算光刻库cuLitho。据他介绍，cuLitho是一项耗时4年的庞大项目。通过与台积电、ASML和Synopsys三家芯片制造厂商合作，cuLitho将计算光刻的速度提升了40倍以上。

为了拥抱AI大模型时代的到来，英伟达在云服务上也有不小动作。

首先，英伟达与微软Azure、Google GCP和Oracle OCI三家云厂商合作推出了NVIDIA DGX Cloud。通过一个浏览器，客户就可以将英伟达DGX AI超级计算机实时接入公司。

其次，面向具有构建、优化和运营定制大语言模型和生成式AI需求的客户，英伟达推出云服务NVIDIA AI Foundations，提供语言、数据和生物学模型的定制服务。比如，英伟达与Adobe已经进行合作，将生成式AI融入营销和创意工作者的工作流程中。

同时，针对ChatGPT等大语言模型的推理训练，英伟达推出了新的GPU H100。H100配备有94GB HBM3的显存，可以支持参数规模达到1750亿的GPT-3，并将大语言模型的处理成本降低一个数量级。

此外，针对生物制药、自动驾驶等细分领域，英伟达也推出了相应的服务。

“我们正处于AI的‘iPhone’时刻。”在演讲中，黄仁勋将这句话强调了三次。他总结：“初创公司竞相构建具有颠覆性的产品和商业模式，而老牌公司则在寻求应对之法——生成式AI引发了全球企业制定AI战略的紧迫感。”在为AI浪潮下的企业提供解法的同时，不甘缺席技术浪潮的英伟达或许也在寻找自己的解法。

来源：36氪