各大厂商都在奋力争夺登上前往AI时代的一张船票。
ChatGPT爆火迄今,英伟达不仅被公认为全球AI淘金时代最大“卖铲人”,也成为各大媒体和社交平台上讨论度最高的一家AI芯片公司。
近日,英伟达发布的2024财年三季报显示,其营收达到创纪录的181.20亿美元,同比增长206%,环比增长34%;净利润再创新高,达到92.43亿美元,同比增长1259%,环比增长49%。
但在科技领域,永远不可能一家独大,随着AI热潮持续升温,越来越多厂商也开始在AI芯片领域发力,前有亚马逊云科技、微软、华为、百度等下游客户推动自研芯片,后有寒武纪、壁仞等小而美的AI芯片独角兽,都奋力争夺登上前往AI时代的一张船票。
今年以来,现在国内有多家公司均在开发自己的大模型,由于担心美国的芯片管制会升级导致英伟达高性能计算芯片断供,国内互联网厂商不得已只能竞相囤积A800芯片,因为谁都不想在人工智能竞赛中落后。
知情人士透露,百度、字节跳动、腾讯和阿里巴巴已向英伟达订购了价值10亿美元的订单,采购约10万个A800芯片将于今年交付。另外,他们还订购了价值40亿美元的芯片将于明年交付。
这也使得英伟达成为生成式AI领域最大的赢家,凭借在生成式AI领域“一卡难求”GPU,英伟达已经赚得盆满钵满,市值更是飙升到1万亿美元。彭博报告显示,随着OpenAI的ChatGPT等服务的涌入,在未来十年内,生成式人工智能市场有望从2022年的400亿美元激增至1.3万亿美元。这也让整个行业吸引来更多玩家。
众所周知,自研AI芯片是一个产业走向成熟绕不开的趋势,但凡哪个厂商AI运算的体量大幅度提升,就需要自家的芯片来支撑,这样才能达到最高的优化。
尤其在数字经济时代背景下,鉴于人工智能领域史无前例的市场前景,打造自有芯片产业链,已经成为国内外科技巨头的战略布局。像谷歌、微软、亚马逊这样的软件和云计算服务巨头加入芯片竞争,势所必然。
12月1日,亚马逊云科技(AWS)在2023 re:Invent全球大会上宣布其自研芯片家族的两个系列推出新一代,包括Amazon Graviton4和Amazon Trainium2,为机器学习训练和生成式人工智能应用等广泛的工作负载提供更高性价比和能效。其中,Graviton4与当前一代Graviton3处理器相比,性能提升高达30%;Trainium2与第一代Trainium芯片相比训练速度提升多达4倍。
11月15日,微软在西雅图举行的Ignite开发者大会上,推出加速AI计算任务的Maia芯片。Maia芯片旨在运行大型语言模型,该芯片的构建方式与英伟达使用的网络连接技术也有所不同,Maia芯片与标准以太网电缆连接在一起。
8月29日,谷歌在旧金山的年度云会议Google Cloud Next上也发布了新的人工智能芯片,即第五代定制张量处理器(TPU)芯片TPU v5e,用于大模型训练和推理。与上一代芯片相比,TPU v5e每一美元的训练性能提高2倍,每一美元的推理性能提高2.5倍。
元宇宙新声认为,芯片可能会在未来很长一段时间都是AI竞争的核心,包括国家、巨头、初创公司之间。但行业发展还处于初期,未来肯定会有一轮洗牌。
随着全球竞争加剧,我国AI芯片行业发展面临重要机遇期。
数据显示,2021年我国AI芯片市场规模达到427亿元,同比增长124%;2022年这一市场规模达到850亿元,再现翻倍式增长。中邮证券预计,到2023年,我国AI芯片市场规模将进一步扩大至1206亿元。
事实上,我国对人工智能芯片产业的发展高度重视,制定了一系列扶持政策,营造了有利的政策环境,促进了行业的快速发展。
近年来,国家陆续出台了多项政策,鼓励AI芯片行业发展与创新,包括《国家新一代人工智能发展规划》《关于深化“双创”促进大众创业万众创新若干政策的通知》等。
北京、上海、深圳等重点城市都陆续发布了支持人工智能产业快速发展的政策,其中包括攻关AI芯片创新突破、加强AI芯片、智能传感器研发攻关、加速智能算力建设等方面的内容。
英伟达CEO黄仁勋曾表示:“中国有很多GPU的初创公司,不要低估中国在芯片领域的追赶能力。”
从国内芯片厂商的现状来看,既有华为这样全产业链路齐头并进的巨头厂商,也有像寒武纪专注于AI算力芯片的厂商,还有专注在通用计算芯片摩尔线程等,这也体现出国内芯片厂商在支持大模型更加智能化的同时,也迎来了行业的“百花齐放”。
不久前,华为在全联接大会上发布了全新架构的昇腾AI计算集群——Atlas 900 SuperCluster,据了解,该AI集群支持超万亿参数的大模型训练,采用全新的智算交换机以及超节点架构。
在任正非的访谈中,他提到目前华为AI集群能力已经不弱于美国。“华为现在的AI集群已支持16000板卡,将来的一个超节点集群可管理几十万板卡。支持超高速互联、超高效的液冷散热、瞬时爆发式供电,达到系统高可用。”
整体来看,华为推出了面向通用计算的鲲鹏系列,面向AI计算的昇腾系列。在架构方面,华为推出了自研达芬奇架构。在软件上,华为推出了openEuler开源OS以及配套的数据库、中间件,涵盖从硬件、架构、框架、应用、开发运维工具等全产业链条。
而寒武纪拥有的AI芯片产品为云端AI芯片和边缘AI芯片。其中,思元370是寒武纪第三代云端智能芯片,是寒武纪首款采用Chiplet(芯粒)技术的人工智能芯片。景嘉微是国内GPU龙头,拥有的AI芯片产品为GPU芯片。
另外,摩尔线程则全面布局GPU领域,现在他们已推出苏堤、春晓等多颗GPU芯片,其中春晓是其第二颗产品,集成220亿颗晶体管,内置MUSA架构通用计算核心以及张量计算核心,可以支持FP32、FP16和INT8等计算精度。
目前来看,在国际高端AI芯片面临被“逼退”之际,国产AI芯片无疑成为最佳替代选择。近年来,在地缘政治影响下,我国本土AI芯片产业已取得一定发展成效,部分产品甚至可对标国际企业同类产品。
不过,需要注意的是,AI芯片硬件性能只是一个方面,想要让国产芯片能用起来,软件能力会是更重要的壁垒之一。算力的释放需要复杂的软硬件配合,才能将芯片的理论算力变为有效算力。
我们看到,目前国内第一批大模型厂商使用的基本都是英伟达A100、A800的芯片,这不仅是英伟达产品性能更强,还因为他们构建了完善的CUDA生态。
CUDA就是英伟达推出的基于GPU的并行计算平台和编程模型,可以用来加速大规模数据并行计算,使得GPU可以用于更加广泛的科学计算和工程计算等领域。CUDA的良好生态系统吸引了众多学术机构和高性能计算中心的关注和使用,也为英伟达提供了强有力的市场竞争优势。
一位分析师告诉元宇宙新声:“经过多年的建设,英伟达的CUDA已经有400万开发者,基本形成了垄断态势的生态壁垒,而软件生态恰恰是下游客户最为重视的产品竞争要素。”如果贸然更换生态,意味着厂商学习成本、试错成本、调试成本都会增加。
不过,面对英伟达CUDA的强势地位,国内AI芯片头部厂商如海光、华为和寒武纪等,也在不断基于自身产品和解决方案,打造生态体系。
比如,海光的DCU产品深算系列采用了兼容通用的“类CUDA”环境;华为的昇腾系列采用自研的达芬奇架构,大模型厂商在使用相关芯片时,需要提前针对软硬件进行调配和优化;寒武纪的产品虽然包含了云端和边端芯片,但由于其ASIC的芯片架构,对通用性计算而言,ASIC芯片的成本优势并不明显。
虽然国内AI芯片行业的生态建设与CUDA还存在着不小的差距,但我们已经看到厂商们在行动,在复杂的国际贸易关系及地缘政治因素等驱动下,“国产替代”成为国内半导体行业发展的主旋律。
当前,芯片已经成为半导体行业中最具有发展潜力的领域之一,AI芯片作为推动芯片行业发展的核心市场,其行业价值无法估量,随着AI芯片技术的逐渐成熟,其应用场景逐步渗透到各类智能终端领域中,在我国科技发展中占据越来越重要的地位。
元宇宙新声发现,在当下的算力领域中,英伟达代表的传统芯片厂商还是占据着统治地位,但以微软、亚马逊云科技以及谷歌等为代表的科技巨头也对于算力芯片这块“肥肉”虎视眈眈,再加上国内如华为、寒武纪等芯片厂商不断发力创新,打破壁垒,俨然成为行业新势力。
这也促使整个AI芯片行业“三国杀”局面初显,而且,这一局面随着AI时代的来临,“三国”将会“厮杀”得更加激烈,最终会是拥有先发优势的传统造芯势力继续一枝独秀,还是科技巨头们后来居上形成“反杀”,仰或是国内厂商实现弯道超车?
可以预见,AI芯片行业每向前走一步,都将挑动着科技领域的神经,这场“三国杀”的胜利将会属于谁呢?未来真让人期待。