小众存储芯片“翻身”：火热的ChatGPT还会催热哪些芯片需求？

作者：界面新闻发布时间：2023-02-22

记者 | 彭新

由OpenAI开发的聊天机器人ChatGPT于去年末发布后，由于表现惊艳，近期在全球刮起了一股猛烈的旋风。微软和谷歌等巨头在此类技术上投入巨资。在国内，百度和其他互联网公司也表示正在开发此类技术，并即将推出。

GPT即预训练大语言模型（Generative Pre-trained Transformer），其基于自然语言处理模型Transformer进行预训练，并不断迭代提升模型能力。大语言模型等此类生成式AI通过海量数据训练，可以产生前所未有的高质量输出，可用于搜索、对话机器人、图像生成和编辑等。

微软使用ChatGPT技术，将其引入搜索引擎必应，借助对话式人工智能（AI），通过准确理解人类提问意图并做出回答，给搜索带来革新。除了文字，预训练大模型还能生成图像，与真人作画相比不分高下的AI画师过去数月多次涌现。

ChatGPT崛起，相关应用用户快速增长下，对运算基础的算力要求越来越高，也将对相关的芯片提出了需求。因其背后技术将高度依赖AI处理能力，并涉及与之相关的网络、存储和算力基础设施。

GPU为AI计算主流

ChatGPT高度依赖AI计算能力，而向OpenAI提供GPU芯片的英伟达正成为最大受益者，摩尔线程摩尔学院院长李丰解释，当人工智能模型通过算法生成内容时，即需要大量数据进行训练，这一过程即在GPU集群进行，随后训练完成的模型又部署在GPU集群进行推断，完成图像生成、语言聊天等工作。

“人工智能的算法是在不断进步和迭代过程当中，GPU实际上兼顾了灵活度以及计算能力，”李丰称，相比专用的AI芯片，GPU灵活性更强，又可以保证AI计算性能，因此受到开发者的欢迎。他提及，在全世界范围内，主要的增长算力的来源来自于GPU。

目前，ChatGPT背后的GPT-3.5模型已有超过1750亿个参数，训练成本高昂，根据国盛证券报告显示，GPT-3训练一次的成本约为140万美元，对于一些更大的大型语言模型，训练成本介于200万美元至1200万美元之间。

以ChatGPT在今年1月的独立访客平均数1300万计算，其对应芯片需求为3万多片英伟达A100 GPU图形处理器，初始投入成本约为8亿美元。此外，据花旗集团预估，ChatGPT将可能促使英伟达相关产品在12个月内销售额达到30亿至110亿美元。

这意味着，ChatGPT等此类应用将会拉动英伟达GPU芯片需求。英伟达公司的GPU图形处理器在大型AI模型培训市场占据主导地位，其股价今年已大涨55% 。

一家大型IT厂商的人工智能部门负责人向界面新闻记者表示，目前在训练端，英伟达是毫无疑问的冠军，其他玩家争夺的市场在于推断端，这部分的任务量较小，对功耗、延迟更敏感。李丰就提及，摩尔线程已经在内部测试，完全部署在摩尔线程GPU上的AIGC平台不久即面世，这是包括了图像生成、自然语言生成等一系列的内容生成平台。

除了GPU，涉及计算能力的芯片类型还包括CPU、FPGA、ASIC等，不同类型的计算芯片进行组合，可以满足不同AI模型的计算需要。

专用AI芯片ASIC（专用集成电路）也有望未来在AI算力中占据一席之地。谷歌此前发布了自研TPU（张量处理器）并多次迭代，这是谷歌特别设计用于机器学习的芯片。依照谷歌提供的数据，TPU计算效率是过往GPU十倍以上。谷歌将TPU部署在自家云平台上，未来该公司将推出的对话式AI服务Bard，也将基于TPU运行。

小众芯片HBM走向前台

在一个计算系统中，与计算相匹配必然还需要存储、网络等架构。无论是CPU、GPU，还是其它专用芯片，在计算过程中均将不可避免的被存储、通信等进程打断，需要行业参与者拿出对应解决方案。

在ChatGPT热潮下，一种小众存储芯片的名气正随着AI计算需求剧增而为外界所知，据《韩国经济日报》报道，受惠于ChatGPT，随着市场对GPU需求剧增，三星、SK海力士的HBM芯片赢得了额外的订单，成为目前存储芯片下行市场中，意外爆红的芯片类型。

HBM（High Bandwidth Memory，高带宽存储器）芯片是一种可以实现高带宽的内存芯片，与普通DRAM内存相比，HBM可以提供更高的数据的传输速度，基于该特性，HBM主要应用于高性能计算场景中，如超级计算机、AI加速器、高性能服务器领域。

HBM在与CPU及GPU协同工作中，可以提高机器学习和计算性能。目前ChatGPT的火热发展已令英伟达等GPU厂商受益——ChatGPT使用了1万多个英伟达的A100 GPU学习了庞大的文档数据。而HBM可以安装在加速卡中，英伟达A100就最高配备80GB HBM2内存。

“HBM一直很难卖，因为价格是DRAM的3倍，但AI是HBM的杀手级应用。”TriOrient Investments副总裁Dan Nystedt称。由于成本高昂，HBM一直难以大规模普及，市场推广较慢，但预计AI应用将为其进一步打开市场规模。

目前，由ChatGpt带动的HBM需求已经引起了上游厂商的关注。SK海力士提及，目前已开发除第四代HBM产品，并于去年向英伟达供货。三星半导体对界面新闻表示，基于人工智能技术的交互式AI的学习和推理需要高性能处理器和支持其高性能存储器组合，这将积极地影响对存储器的需求。

三星HBM-PIM

针对AI应用，三星半导体介绍，已经在存储芯片上结合人工智能处理器的HBM-PIM（Procee in Memory，存内计算）技术上取得了成果，并计划与客户共同构建PIM平台生态系统。

根据市场调研机构Omdia在2021年预测，到2025年，HBM市场的总收入将达到25亿美元，目前来看，这一数字随着AI计算需求增长有望打破。

长期来看，HBM配合CXL等新型数据传输协议也将在增强AI计算性能，并获得行业巨头支持。半导体咨询机构集邦咨询认为，CXL将随着未来CPU内置CXL功能而普及化，在未来AI服务器中，可以见到更多使用HBM和CXL的联合设计方案。

分布式计算呼唤DPU

ChatGPT参数量数以亿计，无法在单台机器上进行有效的训练或推理，因此需要使用分布式计算。在分布式计算中，机器之间的带宽和高效的计算芯片变得至关重要，因为数据互连往往是瓶颈。在数据中心层面，业界期待被视为数据中心“第三颗芯片“的DPU解决此类问题。

“ChatGPT这类语言类生成模型的参数量高达千亿，几乎不可能使用单机训练和推理，而必须大量使用分布式计算。”DPU开发商云脉芯联相关负责人告诉界面新闻，在进行分布式计算时，就需要DPU做一些数据的处理和预处理，由DPU将任务分发给CPU、GPU和FPGA等进行计算。

DPU即数据处理器（Data Processing Unit），用于处理海量数据，在云数据中心中，数据在多个服务器之间来回流动。云厂商通过将网卡改造为DPU，减轻CPU负担，使其专注于更关键的任务，类似于公司前台可以缓解员工的工作量。

业内还预计，除了GPU、HBM、DPU以外，由小芯粒技术Chiplet加持的芯片异构技术，也有望支持算力增长，Chiplet通过把不同芯片的能力模块化，利用新的设计、互联、封装等技术，在一个封装的产品中使用来自不同技术、不同制程甚至不同工厂的芯片。从半导体产业链端来看，包括IP授权、晶圆代工、封测等厂商为之提供关键的技术支持，可视为提升AI算力重要的基础设施。包括Imagination、Arm、台积电、日月光等上下游厂商，将从中获得增长。

小众存储芯片“翻身”：火热的ChatGPT还会催热哪些芯片需求？

推荐体验

相关资讯

英伟达股价大涨，小众存储芯片“翻身”：火热的ChatGPT还会催热哪些芯片需求？

存储芯片的江湖

存储芯片巨头，开启AI算力争霸赛

半导体存储芯片价格1年跌4成

东高科技：存储芯片触底回暖市场拐点将至？

近期资讯

AMD即将发布RX 9070显卡公版功耗超300W

解决键盘锁定问题的常见方法与技巧分享

解决软件安装失败问题的有效步骤与建议分享

高度集成的铭凡 UN1250 迷你主机全新上市 1599元起

万和燃气热水器评测：性能优秀、设计简约、安全保障全面的家居必备设备

轻松掌握视频截取技巧，提升创作与分享的乐趣与质量

HarmonyOS Next 5.0.0.102 发布，华为 nova 系列今日开始推送！

保护个人隐私：手机应用隐藏与安全管理全攻略

世界首片8.6代OLED玻璃基板在国内诞生

小米又有新品！小米MK71 Pro机械键盘将于2025年1月1日开启众筹

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响