文 | 虞景霖
编辑 | 邓咏仪 尚恩
AI芯片之于AI科技公司就像引擎之于汽车,是训练AI大模型的核心部件。随着模型复杂程度的增加,对算力的要求也越来越高,AI芯片的需求量也与日俱增,这点从此前英伟达宣布2023年的GPU芯片全部售罄就可见一斑。
供不应求,价格上涨,加上计算所带来的高昂电费,即使科技公司的资金再充足也不扛不住这么一直造。
来源:公开网络
不少科技公司开始寻求破局之道——使用自家的AI芯片。不仅是为了降低成本,也为了分散供应商单一的风险,例如亚马逊的 Inferentia、谷歌的TPU和脸书的AI芯片组。
这不,微软和OpenAI也坐不住了,前者是成熟的老牌科技巨头,后者是闪耀的初创科技新星,都跃跃欲试计划推出自家的AI芯片。
作为最大的云服务提供商之一,微软对于AI芯片的需求本就庞大,在投资OpenAI后算力资源需求就更紧张了。
根据OpenAI今年1月在官网发布的消息,OpenAI将使用微软的Azure作为唯一服务器,GPT在微软旗下产品的接入让用户数量激增,进一步加剧了算力需求。
对此,一位现任员工表示:“工程师现在很难预测使用这些AI驱动的功能需要多少算力”。另外据知情人士透露,微软一直在为内部团队分配GPU的使用权限,但自今年1月以来,等待时间越来越不确定。
自研AI芯片,缓解算力紧张,迫在眉睫。
来源:视觉中国
尽管微软官方并未透露自研AI芯片的相关消息,但据The Information的报道,微软在2019年就开始了相关布局。
2019年,包括CEO Satya Nadella在内的高管们意识就到微软在芯片供应方面落后于谷歌和亚马逊,知情人士表示,自研AI芯片Athena(雅典娜),就是从那时开始的。
内部人员还透露,目前至少有300名员工正在从事Athena的开发工作,并开放给了一部分微软和OpenAI的员工使用。
微软计划采用台积电生产Athena芯片,最初的版本将采用5nm工艺,假设Athena芯片明年投入量产,制造这款芯片的技术相较于目前最尖端的工艺仍然落后一代。
微软内部也并不认为这款自研的AI芯片能够取代英伟达的产品。但如果研发顺利,微软可以借此增加与英伟达谈判的筹码。
目前,英伟达仍然是微软GPU芯片的重要供应商,微软计划继续与英伟达合作打造新一代超算机。当然,微软也并没有将所有GPU供应都押注到英伟达上,它还计划与AMD就即将推出的AI芯片MI300X进行密切合作。
Maginative消息称,如果一切顺利,微软首款自研芯片或将在下个月推出,具体时间很可能会定在11月14日微软西雅图Ignite大会上。
OpenAI打响了AI之战第一枪,从去年11月推出ChatGPT开始一路狂飙,陆续推出GPT-4、ChatGPT企业版等产品。
来源:OpenAI
产品升级的背后是居高不下的运营成本,主要由四部分组成:“GPU等高性能硬件、云服务等软件、人才招聘和日常运营”。公司的持续运营需要现金流,除了拿投资人的钱开源外,依靠自身节流才能让OpenAI走的更远。
OpenAI将目光瞄准到了支出的最大头“GPU等硬件”。但从0开始完全自研AI芯片至少需要2-4年时间,综合实力强大的微软用了5年都无法推出成熟产品,更别说普通企业。
对于OpenAI而言,相较于自研,先收购再自研或许是一个更优解,这样不仅能够节约时间成本,还能获得对方的硬件核心技术,避免重蹈Meta的覆辙,对公司的竞争力有直接的提升。
知情人士表示,OpenAI曾考虑对潜在收购目标进行尽职调查,具体对象还不得而知。
不过在OpenAI造芯消息曝出后,各界也纷纷猜测谁会被OpenAI收入麾下,而OpenAI及CEO山姆·奥特曼参与投资的芯片公司,自然最先被关注到。
据知情人士透露,OpenAI及CEO山姆·奥特曼已参投了至少三家芯片公司,具体包括Cerebras、Rain Neuromorphics和Atomic Semi这三家。
Cerebras
Cerebras总部位于美国,由Andrew Feldman在2015年成立,目前已完成3轮融资,累计获得超过4.75亿美元的风险投资。
公司首创的晶圆级集成(wafer-scale integration)芯片,是将整片300mm晶圆作为一块芯片进行设计的芯片。一般的GPU芯片的晶体管数量在10-20亿左右,而晶圆级集成芯片集成了超过200亿个晶体管,是目前集成度最高的芯片。
相同芯片面积下,晶体管数量越多,代表能够实现的计算越复杂。可以说晶圆级集成芯片的超大集成度充分满足了AI模型的算力需求,不需要跨芯片通信,减少了数据移动,进而降低了训练时间的能耗。
来源:Cerebras
Rain Neuromorphics
Rain Neuromorphics由来自斯坦福、IBM等机构的科学家在2017年建立,是一家专注于新型神经形态芯片开发制造的初创公司。
新型神经芯片是一种模仿大脑结构和计算方式的芯片。它通过使用类似神经元和突触的硬件单元,用大规模并行方式进行信息处理,从而提高了效率。
相较于传统冯诺依曼体系芯片,新型神经芯片可以进行本地计算,而不用在执行每个指令时都进行读取指令、取数、运算、存储这些流程,从而简化了指令传递过程。同时,新型神经芯片使用了可塑性机制调节连接,而不是依靠外部编程,减少了数据IO与存储,极大降低了功耗。
来源:Rain Neuromorphics
Atomic Semi
Atomic Semi由台积电前工程副总Keith McKay在2018年创立,总部位于美国加利福尼亚州,是一家AI芯片初创公司。
Atomic Semi自主研发了模拟计算架构,直接对电压和电流进行计算,表面数字电路中的复杂转换和时钟同步,相较于数字电路效率更高且功耗更低。
Atomic Semi正在研发代号“Fat Man”的AI训练芯片,采用7nm工艺制造,预计单芯片规模可以达到10万个神经元,性能可达每秒万亿次计算(TOPS, Tera Operations Per Second),主要定位为数据中心训练加速芯片。
来源:Atomic Semi
自2019年起,微软已先后砸钱300亿美元给OpenAI,最大目的就是为了在AI浪潮中搭上那辆最快的顺风车,而今曾经亲密无间的合作伙伴,现在也被频频爆出不合传闻。
根据双方合作的内部文件内容显示,这次微软与OpenAI的合作并不寻常。
首先,双方的合作将分为三个阶段,从利润分配角度来看,第一阶段,微软有权获得OpenAI 75%的利润直至100亿美元的投资额全部收回;第二阶段,当OpenAI的利润达到920亿美元,微软将获得49%的利润;第三阶段,当OpenAI的利润达到1500亿美元后,微软和其他风险投资者将全部归还OpenAI股份。
来源:New York Times
这场交易后,微软有权将OpenAI的王牌产品,ChatGPT嵌入到Bing、Team、Office等应用中,让微软更有底气和谷歌进行抗衡。OpenAI可以使用微软超级计算集群,从而降低模型的训练成本。
但这场看似双赢的交易似乎正在走向崩溃。
《华尔街日报》曾报道,微软内部人员抱怨公司拨给人工智能的预算减少了,而且在访问OpenAI技术的时候受到了限制。
微软和OpenAI都希望通过各自的产品攫取更多市场份额,从而增加营业利润,但双方的产品存在冲突。正如非盈利研究机构艾伦人工智能研究所董事会成员、前CEO Oren Etzioni在《华尔街日报》上表示:
让他们陷入冲突的原因是双方都需要赚钱,而且是通过类似的产品赚钱。
甚至,微软和OpenAI在本次AI芯片竞赛中也都入局,进一步加剧了双方的冲突。
芯片公司也在这波大模型浪潮中互相角力。传统GPU厂商英伟达凭借算力优势,占据AI训练芯片的主导地位,初创公司也寻求在AI芯片上取得技术突破,比如前文提到的奥特曼投资的三家公司。
来源:公开网络
科技巨头也纷纷加入战局,研发专用AI芯片。而模拟芯片的潜在计算效率吸引了巨头们的注意,为性能提升带来新的契机,一些巨头如微软,选择借助自身雄厚的研发实力和资金自研,另一些如OpenAI,则寻求并购。
尽管机会巨大,但工艺水平和设计难题等因素依然限制着新进入者的速度。主要厂商既竞争又合作,初创公司也面临着被并购的风险,形成复杂局面。AI芯片领域仍然充满着不确定性。
长按添加「智涌」小助手入群
👇🏻 添加请备注:公司+职务 👇🏻
欢迎关注