1530亿颗晶体管，AMD甩出最强AI芯片，单个GPU跑大模型

作者：智东西发布时间：2023-06-14

AI芯片生成式AI 英伟达

芯东西6月14日报道，今日凌晨，英伟达的头号劲敌AMD，终于放出了令人期待已久的AI大招。

2014年，苏姿丰成为AMD CEO时，这家芯片企业正濒临生存危机，裁员约1/4，股价徘徊在2美元。随后在苏姿丰的掌舵之下，AMD完成了漂亮的转身，9年来股价飙升近30倍，对英伟达和英特尔两家顶级芯片巨头形成了制衡。

随着生成式AI飓风席卷全球，英伟达GPU被各家大厂争相抢购，焦点很快转移到AMD身上——AMD能否生产出足够强大的AI芯片来打破英伟达近乎垄断的市场地位，抓住新一波AI浪潮？

今日，AMD交出阶段性答卷。

在展示下一代AI芯片MI300X加速器时，苏姿丰满面笑容地说：“我爱这颗芯片”。

MI300X是一个纯GPU版本，采用AMD CDNA 3技术，使用多达192 GB的HBM3高带宽内存来加速大型语言模型和生成式AI计算。

AMD主要客户将在第三季度开始试用MI300X，第四季度开始全面生产。另一种型号Instinct MI300A现在正在向客户发售。

苏姿丰说，人工智能是AMD“最大、最具战略意义的长期增长机会”。

现场，AMD与明星AI独角兽企业Hugging Face宣布了一项新的合作伙伴关系，为AMD的CPU、GPU和其他AI硬件优化他们的模型。

除了AI芯片外，AMD还推出专为云计算和超大规模用户设计的全新EPYC服务器处理器，代号为Bergamo，每个插槽最多包含128个内核，并针对各种容器化工作负载进行了优化。

亚马逊旗下云计算部门AWS、甲骨文云、Meta、微软Azure的高管均来到现场，分享在其数据中心使用AMD芯片及软件的感受。

01. 加速生成式AI：

192GB HBM3，单个GPU跑大模型

此前，AMD Instinct GPU已经被许多世界上最快的超级计算机采用。

MI300X加速器是AMD Instinct MI300系列的新成员，提供一个仅有GPU配置的芯片版本。

MI300X及其CDNA架构专为大型语言模型和其他先进AI模型而设计，将12个5nm chiplets封装在一起，共有1530亿颗晶体管。

这款全新AI芯片舍弃了APU的24个Zen内核和I/O芯片，转而采用更多的CDNA 3 GPU和更大的192GB HBM3，提供5.2 TB/s的内存带宽和896GB/s的无限带宽。

MI300X的HBM密度是英伟达H100的2.4倍，带宽是英伟达H100的1.6倍，这意味着AMD可以运行比英伟达芯片更大的模型。

AMD演示了在单个MI300X GPU上运行拥有400亿个参数的Falcon-40B大型语言模型，让它写了一首关于旧金山的诗。

“模型尺寸变得越来越大，你需要多个GPU来运行最新的大型语言模型，”苏姿丰说，随着AMD芯片上内存增加，开发者将不需要那么多GPU。

另一款MI300A被苏姿丰称作“面向AI和高性能计算的全球首款APU加速器”，将多个CPU、GPU和高带宽内存封在一起，在13个chiplets上拥有1460亿颗晶体管。

MI300A采用5nm和6nm制程、CDNA 3 GPU架构，搭配24个Zen 4核心、128GB HBM3，相比MI250提供了8倍以上的性能和5倍以上的效率。

AMD还公布了一种AMD Infinity架构。该架构将8个 MI300X加速器连接在一个考虑了AI推理和训练的标准系统中，提供共1.5TB HBM3内存。

据台媒报道，AMD的Instinct MI300系列以及英伟达的H100/H800系列GPU都在采用台积电先进的后端3D封装方法CoWoS，导致台积电CoWoS产能短缺将持续存在。台积电目前有能力每月处理大约8000片CoWoS晶圆，其中英伟达和AMD合计占了大约70%到80%。

此外，英伟达近年备受开发者偏爱的一大关键护城河是CUDA软件。AMD 总裁Victor Peng也展示了AMD在开发软件生态方面所做的努力。

AMD计划在AI软件生态系统开发中采用“开放（Open）、成熟（Proven）、就绪（Ready）”的理念。

AMD的ROCm是一套完整的库和工具，用于优化AI软件栈。不同于CUDA，这是一个开放的平台。

AMD还分享了PyTorch与ROCm的合作。新的PyTorch 2.0的速度几乎是之前版本的两倍。AMD是PyTorch基金会的创始成员之一。

AMD正在不断优化ROCm。Victor Peng说：“虽然这是一段旅程，但我们在构建可与模型、库、框架和工具的开放生态系统协同工作的强大软件栈方面取得了真正的巨大进步。”

02. 云原生处理器Bergamo：

128核，256个线程，最高vCPU密度

再来看下AMD的数据中心CPU。

苏姿丰首先分享了AMD EPYC处理器的进展，特别是在全球范围内可用的云计算实例方面。

她强调说，AMD第四代EPYC Genoa处理器在云计算工作负载方面的性能是英特尔竞品的1.8倍，在企业工作负载方面的性能提高到1.9倍。

绝大多数AI都在CPU上运行，AMD称，与英特尔至强8490H相比，第四代EPYC在性能上遥遥领先，性能优势高出1.9倍。

苏姿丰说，云原生处理器以吞吐量为导向，需要最高的性能、可扩展性、计算密度和能效。

新发布的Bergamo，便是云原生处理器市场的入口。

该芯片有820亿颗晶体管，提供了最高的vCPU密度。

在大散热器下，有一个表面看起来非常像以前的EPYC的芯片，跟与Rome或Milan一样有中央I/O芯片和8个核心复合芯片（CCD）。

Bergamo的每个插槽有多达128个核心、256个线程，分布在8个CCD上，每个CCD的核心数量是Genoa 16个核心的两倍，采用比标准Zen 4内核提供更高密度的全新Zen 4c核心设计，并支持一致的x86 ISA。

“Zen 4c针对性能和功耗的最佳平衡点进行了优化，这为我们提供了更好的密度和能效，”苏姿丰在演讲中谈道，“结果设计面积缩小了35%，每瓦性能显著提高。”

Bergamo现在正在向AMD的云客户发货。AMD还分享了第四代EPYC 9754与英特尔至强8490H的性能、密度和能效和对比：

除了Bergamo的新核心和Chiplet架构之外，该处理器与Genoa有很多共同之处，包括支持12通道DDR5内存、最新PCIe 5.0、单插槽或双插槽配置等等。

不过，多核心不再只是AMD处理器独有的特色。不久之前，数据中心处理器新起之秀Ampere Computing刚推出拥有多达192个单线程Ampere核心的Ampere One系列处理器。英特尔也计划在2024年初推出内核优化的至强处理器Sierra Forest，将内置144个高效能核心。

AMD还展示了其最新的缓存堆叠X芯片，代号为Genoa-X，现已上市。

该芯片针对高性能计算工作负载，包括计算流体动力学、电子设计自动化、有限元分析、地震层析成像及其他带宽敏感型工作负载，这些工作负载受益于大量共享缓存。

Genoa-X CPU基于AMD的标准Genoa平台，采用AMD 3D V-Cache技术，通过在每个CCD上垂直堆叠SRAM模块来提高可用的L3缓存。

该芯片可提供多达96个内核和总计1.1GB的L3高速缓存，每个CCD上堆叠了一个64MB SRAM块。

据AMD披露的数据，在各种计算流体动力学和有限元分析工作负载方面，与英特尔最高规格的60核Sapphire Rapids至强相比，Genoa-X缓存提升的性能提高到2.2倍到2.9倍。

下图是Genoa-X与相同数量核心的英特尔至强的性能对比：

03.即将推出全新DPU

最后，AMD简要介绍了其网络基础设施。

去年AMD以19亿美元收购Pensando，进入DPU赛道。AMD解释了如何使用其DPU来减少数据中心的网络开销。

AMD将其P4 DPU架构称作“世界上最智能的DPU”，并称其Pensando SmartNIC是新数据中心架构不可或缺的一部分。

AMD还在现场展示了与Aruba Networks共同开发的智能交换机。AMD计划将P4 DPU卸载集成到网络交换机本身，从而提供机架级服务。

AMD最新的DPU旨在从CPU卸载网络、安全和虚拟化任务，与当前一代P4 DPU相比将提供更高的性能和能效。

其DPU已得到微软、IBM云、甲骨文云等许多主要云提供商以及VMware虚拟机管理程序等软件套件的支持。

AMD打算在今年晚些时候推出Giglio DPU之前扩大兼容软件列表，推出“芯片软件开发工具包”，以便用户更轻松地在其DPU上部署工作负载。

04. 结语：到2027年，数据中心AI加速器

市场规模将超过1500亿美元

全球数据中心GPU和CPU的头部企业英伟达和英特尔均在强调其加速AI的实力。作为这两条赛道“万年老二”的AMD，也在竞相满足对AI计算日益增长的需求，并通过推出适应最新需求的数据中心GPU来挑战英伟达在新兴市场的主导地位。

生成式AI和大型语言模型的应用热潮正在将数据中心推向极限。截至目前，英伟达在提供处理这些工作负载所需的技术方面具有优势。根据市场调研机构New Street Research的数据，英伟达占据了可用于机器学习的GPU市场的95%。

“我们仍处于AI生命周期的非常、非常早的阶段，”苏姿丰预测，到2027年，数据中心AI加速器总潜在市场规模将增长5倍，从今年的300亿美元左右以超过50%的复合年增长率增长到2027年的1500亿美元以上。

AMD并未透露两款MI300新芯片的价格，但这可能会给英伟达带来一定价格压力，之前H100价格据传高达30000美元乃至更多。

本文来自微信公众号“芯东西”（ID:aichip001），作者：ZeR0，编辑：漠影，36氪经授权发布。

近期资讯

“全方位·高性能”，康耐德储能EMS系统硬件配套方案

前几期，我们为大家介绍了康耐德储能EMS监测系统和平台的介绍。今天，我们接着为大家介绍，储能EMS系统中的关键一环，硬件配套方案。储能EMS系统硬件配套方案在储能柜监测场景下，设备监测环境复杂，需要对接各种模块接口，如LAN口、485口、CAN口、I/O等，对接协议也多种多样如电力各种规约，对上MQTT等物联网协议。同时储能系统在很多策略中对实时性要求较高，如防逆流、充放电控制等，特殊场景需要100ms以内。所以需要一套“全方位、高性能”的配套硬件产品，让EMS监测系统运行更高效、更安全。对此，在康耐德储

康耐德KonNaD 2024-12-29

高精度气体质量流量计

高精度质量流量计广泛应用于各个行业，其中包括食品和饮料制造、化工、制药、能源和水处理等领域。在食品行业中，它们确保了配料的精确比例，保证了产品的口味和质量。在化工和制药行业，它们则是确保化学反应精确进行和药品剂量准确无误的重要工具。而在能源行业，它们帮助监控和管理燃料的使用，提高了效率和安全性。高精度质量流量计是能够准确测量流体通过管道的流量的装置。与传统的体积流量计不同，质量流量计直接测量通过传感器的质量流量，不受流体密度、温度或压力的影响。因为这一独特的属性，使质量流量计能够在不同的工况下依旧能够保

质量流量 2024-12-29

年底价格战加速开卷，血拼抄底的汽车市场到底会卷向何方？

每年岁末年初都是各家车企的促销旺季，各大车企都会集中在年底冲销量，在这样的情况下打折促销就成为了常态，就在最近有媒体曝出多家品牌集体降价，甚至有大降超4成的情况，让人不禁想问这血拼抄底的车市到底该卷向何方？一、年底价格战加速开卷？据21世纪经济报道的消息，一轮新的价格波动来袭，打破了秋季降价潮的平稳过渡，自主品牌价格直降、0息方案、权益加码；合资品牌限时“一口价”、购车礼包附加……年末冲量，车市价格血拼迎来“抄底”时刻。据21世纪经济报道记者不完全统计，包含上述车企在内，长安汽车、吉利汽车、小鹏汽车、上汽

江瀚视野 2024-12-29

海风数码 2024-12-29

【高中历史】小论文高分答题模板，有了它，成绩稳上85+！

高中历史主观题是同学们在历史这门学科中总会遇上各种各样问题的学科，比如：答题没思路、踩不中得分点、“写了一篇纸，得了两三分”等等。其实，历史主观题最主要就是抓住“材料”，剩下的把知识点套进答题模板中，分数唰唰就上去了。这也就要求同学们平时一定要扎实基础知识。今天，学姐给大家整理了“高中历史小论文高分答题模板”，很多同学领到了都说很有用，这次无常分享给大家，guan+ping111发你完整版哦~ [图片] [图片] [图片] [图片] [图片] [图片]

抹茶巧克力蛋糕奶昔 2024-12-29

超高性价比降噪耳机排行榜：2025年必买耳机清单

对于许多喜欢音乐和追求音质的人来说,一副优秀的降噪耳机无疑是必备装备。但高品质的降噪耳机往往价格不菲,这让不少消费者望而却步。好在近年来市面上涌现出许多性价比极高的降噪耳机产品,既满足了音质需求,又不会给用户的钱包带来沉重负担。今天,我就为大家盘点一下2025年最值得入手的超高性价比降噪耳机,希望能为各位的选购之旅提供一些参考和建议。推荐榜单 No.1：览邦（LANBANG）LairPods Pro+在降噪耳机市场日益激烈的竞争中，国产品牌览邦（LANBANG）凭借其旗舰产品LairPods Pro+脱颖

江诗一墨 2024-12-29

云工单管理系统详解：数字化与效率化的桥梁

云工单管理系统基于云计算，优化任务管理，提升效率。可跨设备访问，成本效益高，易于扩展，数据安全。ZohoDesk平台助力简化流程，广泛应用于IT服务、客户支持和内部任务分配。一. 什么是云工单管理系统?云工单管理系统是一种基于云计算技术的工单处理和管理解决方案。它允许组织通过互联网创建、分配、跟踪和管理工单。这种系统通常用于IT服务管理、客户服务支持和内部任务分配等领域。系统的云基础使得数据可以跨多个设备实时同步，保证信息的即时更新和高度可用性。Zoho Desk等平台提供的功能，可进一步帮助简化这些流程

Zoho云服务 2024-12-29

企业邮箱满负荷？扩容步骤与最佳实践

企业邮箱容量满时，可登录账户查现状、清理无用邮件、用云存储服务，或升级邮箱套餐解决。Zoho邮箱提供多种套餐选择，支持自动化同步备份，保障数据安全。一、了解邮箱容量现状首先，需要登录到您的公司域名邮箱账户，查看当前的邮箱容量使用情况。大多数企业邮箱服务都会提供一个清晰的界面，展示已使用的空间和剩余的空间。对于Zoho邮箱用户来说，可以通过以下简单的几步操作轻松查看这些信息，登录邮箱账户，点击头像，查看自己邮箱已用和剩余的邮箱存储容量。二、清理无用邮件在考虑扩容之前，建议先清理一下邮箱中的无用邮件。删除垃圾

Zoho云服务 2024-12-29

1530亿颗晶体管，AMD甩出最强AI芯片，单个GPU跑大模型

01. 加速生成式AI：

192GB HBM3，单个GPU跑大模型

02. 云原生处理器Bergamo：

128核，256个线程，最高vCPU密度

03.即将推出全新DPU

04. 结语：到2027年，数据中心AI加速器

市场规模将超过1500亿美元

推荐体验

相关资讯

AMD 最强 AI 芯片发布晶体管达1530亿颗

1530亿晶体管芯片发布，AMD正式叫板英伟达

1530亿晶体管!AMD重磅推出超级芯片“助力”英伟达市值正式破万亿

AMD推出MI300X：拥有1530亿晶体管，可运行800亿参数模型

AMD史上最大芯片炸场CES：1460亿晶体管 8倍性能提升

近期资讯

“全方位·高性能”，康耐德储能EMS系统硬件配套方案

高精度气体质量流量计

年底价格战加速开卷，血拼抄底的汽车市场到底会卷向何方？

外贸客户开发：邮件营销的增速秘籍

项目管理核心：里程碑与任务的双重价值

猝不及防！智能鱼缸爆火，做投影的当贝和小米，谁的智能鱼缸更强

【高中历史】小论文高分答题模板，有了它，成绩稳上85+！

超高性价比降噪耳机排行榜：2025年必买耳机清单

云工单管理系统详解：数字化与效率化的桥梁

企业邮箱满负荷？扩容步骤与最佳实践

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响