英伟达发布AI芯片H200：性能飙升90%，Llama 2推理速度翻倍

作者：DoNews发布时间：2023-11-14

DoNews11月14日消息，英伟达北京时间13日发布了下一代人工智能超级计算机芯片，这些芯片将在深度学习和大型语言模型（LLM）方面发挥重要作用，比如 OpenAI 的 GPT-4。

新芯片相比上一代有了显著的飞跃，将被用于数据中心和超级计算机，处理诸如天气和气候预测、药物发现、量子计算等任务。

此次发布的关键产品是基于英伟达的“Hopper”架构的 HGX H200 GPU，是 H100 GPU 的继任者，也是该公司第一款使用 HBM3e 内存的芯片，这种内存速度更快，容量更大，因此更适合大型语言模型。

英伟达称：“借助 HBM3e，英伟达 H200 以每秒 4.8 TB 的速度提供 141GB 的内存，与 A100 相比，容量几乎是其两倍，带宽增加了 2.4 倍。”

在人工智能方面，英伟达表示，HGX H200 在 Llama 2（700 亿参数 LLM）上的推理速度比 H100 快了一倍。HGX H200 将以 4 路和 8 路的配置提供，与 H100 系统中的软件和硬件兼容。

它将适用于每一种类型的数据中心（本地、云、混合云和边缘），并由 Amazon Web Services、Google Cloud、Microsoft Azure 和 Oracle Cloud Infrastructure 等部署，将于 2024 年第二季度推出。

英伟达此次发布的另一个关键产品是 GH200 Grace Hopper“超级芯片（superchip）”，其将 HGX H200 GPU 和基于 Arm 的英伟达 Grace CPU 通过该公司的 NVLink-C2C 互连结合起来，官方称其专为超级计算机设计，让“科学家和研究人员能够通过加速运行 TB 级数据的复杂 AI 和 HPC 应用程序，来解决世界上最具挑战性的问题”。

GH200 将被用于“全球研究中心、系统制造商和云提供商的 40 多台 AI 超级计算机”，其中包括戴尔、Eviden、惠普企业（HPE）、联想、QCT 和 Supermicro。

其中值得注意的是，HPE 的 Cray EX2500 超级计算机将使用四路 GH200，可扩展到数万个 Grace Hopper 超级芯片节点。

相关资讯

蓝鲸财经 2023-11-14

英伟达发布人工智能芯片HGX H200

当地时间周一，英伟达发布了人工智能（AI）芯片HGX H200，该GPU利用Hopper架构来加速人工智能应用。

英伟达人工智能

2023-11-14

英伟达H200发布，性能很强，奈何买不到

前几天，OpenAI一场开发者大会，让整个AI人工智能行业的从业者几乎彻夜难眠。

英伟达 OpenAI 人工智能

镁客网 2023-12-18

英伟达发布AI芯片H200：性能飙升90%，Llama 2推理速度翻倍

推荐体验

相关资讯

英伟达发布新款AI芯片H200性能升级

最强AI芯片英伟达H200,Llama2-70B推理提速90%,2024年二季度发货

英伟达发布性能可提升90%的顶级AI芯片H200，当日股价一度涨1.4%

英伟达发布人工智能芯片HGX H200

英伟达H200发布，性能很强，奈何买不到

近期资讯

基于数字化转型的中医药企业智慧供应链模式

华为官宣：奖金300万元！

SpaceX计划今年进行144次发射，已完成133次

史诗升级！iPhone 17将全系用上高刷

六足机器人打完冰壶还要登月六条腿为什么能更强？

AI用“错”了，人真的会变笨！没骗你

国产大飞机进展神速，CR929突破大瓶颈，波音是否会退出我国市场

AMD RX 9070 XT功耗超过300W！但拒绝16针供电

看看今年花多少支付宝年度总结来了：首页下拉可领

【实探】华为手机，大降价！

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响