3月31日消息,据外媒The Information报道称,微软和 OpenAI正在开发一个大型数据中心,可以容纳拥有数百万个 GPU 的专注于人工智能(AI)的超级计算机,预计该项目可能将耗资“超过 1150亿美元”。微软将会为该数据中心支付相关费用,可能将比当今一些最大的数据中心“贵100倍”。
报道称,目前该AI超级计算机项目在 OpenAI 内部被称为“Stargate”(星际之门),预计这将是OpenAI和微软希望在未来6年内建造的一系列数据中心项目中最大的一个,两家的高管们希望它能在 2028 年之前运行。
知情人士透露,OpenAI 和微软计划分五个阶段来建造这些超级计算机,最早可能会在 2026 年启动,并且可能会建在美国威斯康星州的普莱森特山。整个AI超级计算机系统可能需要几个“Stargate”,可能需要非常庞大的电力(“至少几吉瓦”)支持,以至于微软和 OpenAI 正在考虑替代能源,例如核能。
显然,这种规模的数据中心将具有非常高的挑战性,部分原因是现有设计需要“将更多的 GPU 放入单个机架中,以提高芯片的效率和性能”。这还意味着要设计新颖的方法来解决散热问题。
报道称,OpenAI 希望避免在 Stargate 中使用 Nvidia 的 InfiniBand 电缆,尽管微软在其当前AI数据中心中使用了它们。 OpenAI 声称它宁愿使用以太网电缆。这似乎意味着OpenAI希望降低对于英伟达GPU芯片的依赖。
关于“Stargate”,目前还有很多事情有待确定,因此其整体的计划和所需的资金似乎都可能会发生变化,也不清楚相关细节何时能最终确定。
值得注意的是,今年早些时候,有传闻称 OpenAI CEO Sam Altman 计划打造自研的AI芯片,并希望筹集高达 7 万亿美元的资金来自建工厂来生产这些芯片。去年,微软也推出了专门用于人工智能项目的 128 核 Arm 数据中心 CPU 和 数据中心AI芯片Maia 100。有报道称微软正在为其AI数据中心开发自己的网络设备。
随着生成式人工智能爆发,对于NVIDIA GPU 需求量也是暴涨,不仅供不应求,价格也是持续攀升。因此微软和 OpenAI 等公司希望能够有其他更具性价比的选择,同时也希望避免对于英伟达的过度依赖。
微软首席通信官 Frank Shaw 告诉The Information :“我们一直在规划下一代基础设施创新,以继续推动人工智能能力的发展。”
微软已在与 OpenAI 的合作中投入了130亿美元,让OpenAI能用微软的数据中心来运行ChatGPT。如果“Stargate”项目成为现实,那么投资将会变得更为巨大,双方这种合作关系只会变得更深、更复杂。
编辑:芯智讯-浪客剑