据《The Information》11月18日消息,英伟达新一代 Blackwell GPU 在高容量服务器机架中存在严重的过热问题。 Blackwell GPU 专为 AI 和高性能计算(HPC)所设计,但在配置可搭载 72 个处理器的服务器中出现过热问题,不符合AI训练和 HPC 的高功耗需求。 [图片] 过热问题可能会导致在AI训练、高性能计算的过程中出现一系列风险: 性能降低:为了防止硬件损坏,服务器可能会自动降低GPU的工作频率,这会直接影响其处理能力,进而影响AI训练的效果。 硬件损坏:长时...【查看原文】