当前位置:首页|资讯|马斯克|人工智能|OpenAI

单机群10万块H100,凌晨悄然启动,马斯克这是要干嘛?

作者:英智未来发布时间:2024-07-29



7月22日,马斯克在社交平台宣布,他的X超级计算机集群在美国孟菲斯时间深夜4:20正式启动。



这个人工智能训练集群,配备了10万块采用液冷技术的NVIDIA H100显卡,并通过一个单一的RDMA网络连接,展现出前所未有的计算能力。

马斯克认为,截止到今年12月,从各项指标来看,这对于训练世界最强大的AI模型来说都是一个显著的优势。


10万块H100是什么概念?

根据当前H100的市场价约2.5万美元/块,仅显卡成本就高达25亿美元,这还未计算其他硬件、网络、电力等费用。要知道,OpenAI的GPT-4也只用了25,000块。

马斯克选择在深夜4:20启动集群,可能也是为了节省电费......

马斯克究竟要用这个"史上最强AI训练集群"干什么呢?

从网友的猜测来看,很可能是为了训练Grok3。如果真是这样,用这么强大的算力来训练,恐怕OpenAI不继续加码硬件设施,其未来发布的GPT-5很可能难以超越Grok3。

不过,前推特AI基础设施负责人Tim Zaman提到,技术挑战同样不容忽视,在如此庞大的集群中,故障管理将是一个巨大的难题。

另外,网络结构也是一个值得关注的问题,10万块GPU如何高效协同工作?单一网络结构是否真的是最优选择?这些问题的答案,或许会为未来的超大规模AI集群指明方向。

但无论如何,马斯克的这一举动再次印证了,在AI领域,算力就是核心驱动力


在 AI 发展的浪潮中,我们深知强大算力对于推动 AI 创新的关键作用。英智未来专注于提供高效、稳定、灵活的算力租赁服务,助力您的 AI 项目飞速发展。

无论您是科研机构、创新企业还是个人开发者,英智未来的算力租赁都能为您量身定制解决方案,让您无需为高昂的硬件投入和复杂的运维烦恼,轻松拥抱 AI 新时代!




Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1