日前,英伟达的股价再次迎来上涨,总市值超过 2 万亿美元,成为继苹果(2.83 万亿美元)和微软(3.06 万亿美元)之后第三家估值超过 2 万亿美元的美国公司[1]。
该公司之所以在过去一年里取得如此迅猛的市值增长,主要是因为其在 AI 芯片市场发挥的领先作用。
显而易见,随着以 ChatGPT 为代表的大语言模型的陆续出现,引发了全世界生成式 AI 市场的蓬勃发展。
根据数据统计公司 Statista 提供的数据,预计到 2024 年,生成式 AI 的市场规模将达到 666.2 亿美元,到 2030 年市场规模有望达到 2070 亿美元[2]。
要想构建对于发展大语言模型来说至关重要,并且用于深度学习、大规模模拟和并行处理的应用程序,少不了使用由英伟达开发的 GPU 芯片。
图丨英伟达发布的 H100 芯片(来源:英伟达官网)
不过,由于种种原因,自 2018 年以来全球芯片一直存在短缺的现象,这给 AI、电子、汽车、医疗等行业的正常生产带来沉重打击。
一面是 GPU 短缺,一面是对生成式 AI 服务需求的持续增长,这种供不应求的态势也让英伟达于 2022 年发布的 H100 芯片极其昂贵,并且,为打造最好的生成式 AI 产品,包括腾讯、微软、Meta 等在内的中美科技公司都在追捧这款 AI 芯片。
图丨预计 H100 已于 2023 年交付给部分买家(来源:CB Insights)
其中,需要说明的是,H100 是英伟达继 A100 之后推出的最新旗舰 AI 芯片,它作为 AI 基础设施的核心,具有强大的计算能力,能够帮助训练和部署可以生成文本、图像和音频的大语言模型。
另外,根据 CB Insights 发布的 2024 年生成式 AI 预测报告,一颗 H100 的制造成本大约为 3320 美元,但平均售价已经达到 3 万美元,最高售价甚至一度达到将近 10 万美元[3]。
图丨H100 售价大幅上涨(来源:CB Insights)
从另一视角来看,这种囤积芯片的行为,也体现出大型科技公司对英伟达的过度依赖。
在意识到这一点以后,亚马逊、谷歌、微软和 Meta 等科技巨头纷纷构建自己的 AI 芯片,以及通过投资 AI 初创企业等举措,试图摆脱上述依赖,并开始试图抢占芯片市场份额。
具体来说,谷歌部署 TPU(Tensor Processing Units,张量处理器)已经有 8 年时间。
2017 年,该公司发布一款新的专用集成电路产品 TPU,能够支持 AI 神经网络的训练以及训练后的推理。
基于数以万计的 TPU,谷歌成功地构建了自己的 AI 产品,其中就有聊天机器人工具 Bard。
并且,包括 Cohere 在内的其他 AI 公司也在通过谷歌的云服务使用这些芯片,并构建类似的技术。
紧随谷歌之后的亚马逊,分别于 2019 年和 2021 年发布了 Inferentia 和 Trainium 两款芯片。
前者可提供低成本、高通量的机器学习推理,后者旨在训练机器学习模型,包括用于生成式 AI 的模型。
另外,该公司还于 2023 年 9 月给 Anthropic 这家 AI 公司注入 40 亿美元的资金,后者将使用亚马逊的定制芯片来构建 AI 模型。
亚马逊 CEO 安迪·贾西(Andy Jassy)曾在该公司 2023 年第 4 季度财报电话会议中表示:“要获得每个人都想要的 GPU 数量确实很困难。
因此,这也是亚马逊的 Inferentia 和 Trainium 芯片对人们如此具有吸引力的一个重要原因。”
2023 年 5 月和 11 月,Meta 和微软两家公司分别发布了定制 AI 芯片 MTIA 和 Maia 100。
前者是针对 Meta 内部推理工作负载定制的,在性能、延迟和效率方面都具有良好的表现,后者使用 5 纳米工艺制造,能很好地应用于大语言模型的训练和推理。
据了解,在开发和测试 Maia 100 的过程中,微软不仅和 OpenAI 开展了广泛合作,还将基于该产品为后者的 AI 模型提供优化和改进。
事实上,上述公司开发与 AI 有关的定制芯片的行为,有助于它们控制成本、消除芯片短缺,并最终向使用其云服务的企业出售芯片。
正如 AI 初创公司 Nervana 的 CEO 兼联合创始人纳文·拉奥(Naveen Rao)所言:“理论上,如果它们能够达到足够高的产量并降低成本,这些公司应该能够提供比英伟达更好的产品。”
不过,从目前来看,它们在短期之内很难超越英伟达,即便后者开发的芯片价格昂贵,但却是市场上性能最高、能与更多软件完美配合的芯片之一。
亚马逊 AWS 计算和网络副总裁大卫·布朗(David Brown)对媒体表示:“我们还有许多年的艰苦创新要做。”
我们看到各科技公司竞相开发定制芯片,但明显的是,英伟达也不会停滞不前。
参考资料:
1.https://www.theverge.com/2024/2/1/24058186/ai-chips-meta-microsoft-google-nvidia
2.https://www.statista.com/outlook/tmo/artificial-intelligence/generative-ai/worldwide
3.https://www.cbinsights.com/research/report/generative-ai-predictions-2024/
https://www.linkedin.com/pulse/amazons-strategic-move-custom-chips-excel-generative-ai-race-greyb-nrblf
https://tickernerd.com/earnings-call/amazon/
https://www.forbes.com/sites/moorinsights/2017/05/22/google-cloud-tpu-strategic-implications-for-google-nvidia-and-the-machine-learning-industry/?sh=1fc67e963af7
https://www.zdnet.com/article/microsoft-unveils-first-ai-chip-maia-100-and-cobalt-cpu/
https://about.fb.com/news/2023/05/metas-infrastructure-for-ai/
https://medium.com/@theeyessource/unveiling-microsofts-groundbreaking-chips-the-maia-100-ai-accelerator-and-cobalt-100-cpu-a00e8ab195ec
https://www.theverge.com/2023/11/15/23960345/microsoft-cpu-gpu-ai-chips-azure-maia-cobalt-specifications-cloud-infrastructure
https://unu.edu/article/when-chips-are-down-increasingly-cutthroat-political-economy-computer-chips
https://www.cnbc.com/2023/04/14/nvidias-h100-ai-chips-selling-for-more-than-40000-on-ebay.html
https://www.businessinsider.com/meta-zuckerberg-stockpile-tech-hottest-commodity-nvidia-chips-semiconductors-2024-1
https://www.nytimes.com/2024/01/29/technology/ai-chips-nvidia-amazon-google-microsoft-meta.html
https://www.businesstimes.com.sg/companies-markets/telcos-media-tech/nvidia-market-cap-threatens-alphabet-after-overtaking-amazon
https://dig.watch/updates/amazon-introduces-its-next-gen-ai-chip-intensifying-rivalry-with-microsoft-and-google
运营/排版:何晨龙
化工365 2024-11-18
壹定科技-李星泽 2024-11-18