OpenAI把微软电网搞崩！GPT-6被曝25年发布，训练刷爆10万张H100

作者：书圈发布时间：2024-03-29

OpenAI 微软 GPT-5 AGI

新智元报道

编辑：编辑部

【新智元导读】GPT-5还未发布，GPT-6已经在路上了？微软工程师曝出，为GPT-6搭建10万个H100训练集群，整个电网却被搞崩。通往AGI大关，还需要破解电力难题。

GPT-6也被电力卡脖子了——部署十万个H100时，整个电网发生了崩溃！

就在刚刚，微软工程师爆料，10万个H100基建正在紧锣密鼓地建设中，目的就是训练GPT-6。

微软工程师吐槽说，团队在部署跨区域GPU间的infiniband级别链接时遇到了困难。

Corbitt：为何不考虑直接将所有设备部署在同一个地区呢？

微软工程师：这确实是我们最初的方案。但问题是，一旦我们在同一个州部署超过100,000个H100 GPU，电网就会因无法负荷而崩溃。

这是创业者Kyle Corbitt在社交媒体上，分享自己与一位微软工程师关于GPT-6训练集群项目的对话

没想到，GPT-5还没发，微软就已悄悄为OpenAI开始训练GPT-6了。

同在今天，一张「OpenAI内部时间线」图片在网上疯转。

图中清晰标注出：OpenAI早在2022年8月-10月之间开始了GPT-5（代号Arrakis）的训练，2023年4月GPT-4.5（代号Gobi）在训练中。

并且图中显示，GPT-6的测试，预计早在去年9月就开始了！

同时，关于GPT-5（Arrakis）的一个爆料帖，也随之浮出水面。

太长不看版

贴中爆出许多内幕消息。

比如，GPT-4.5因为能力不够，干脆被跳过，所以今年OpenAI会直接发GPT-5。

另外还有若干未经证实的消息（从上图中也可以看出），关于OpenAI手中握着的一大把模型——

比如，Arrakis/GPT-5在GPT-4不久后训练了3个月，于22年10月结束；在GPT-5之后，GPT-4.5于23年4月完成训练。

最劲爆的消息当然就是，现在GPT-6或许已经在训练中了。

但是，GPT-5并不是AGI，因为无法解决「量子引力」问题。同理，GPT-6也不是AGI。

接下来，让我们一一盘点下，帖子中都有哪些信息点。

最接近AGI的模型，与人类专家不相上下

去年8月，FeltSteam最先曝出OpenAI内部正在进行一个Arrakis多模态模型的项目，远超GPT-4，非常接近AGI。

Arrakis项目被首次提及，是名叫FeltSteam的网友最先在Reddit一个评论区中爆料称，「Arrakis和Gobi都很酷」。

并且，他在r/singularity板块中另一个问题下，介绍了Arrakis的一些能力。

他提到，「这是一个无所不能的模型，可以输入文本、图像、音频和视频的任何组合」。

具体来说，Arrakis更多的细节包括：

- 多模态模型

- 性能远超GPT-4

- 接近AGI

- 幻觉发生率明显低于GPT-4

- Altman正试图将Arrakis作为一种工具来推销，尽管它是有感情的

- 推理成本略低于GPT-4

- 非常优秀的自主智能体

- 训练一般数据是合成的

与此同时，Jimmy Apples在社交媒体上曝出了OpenAI内部代号Gobi的项目——大规模多模态模型。

除了以上两个项目，一个代号名为「Sunshine」的项目逐渐浮出水面。

OpenAI这些秘密进行的项目，一时间引来许多网友的猜测和讨论。

随后，FeltSteam又爆出了更多的细节，Arrakis据称有125万亿参数，大约是GPT-4的100倍，并在2022年10月完成训练。

值得一提的是，Arrakis不是通过计算资源实现的，而是通过提高计算效率实现的。

目前，OpenAI内部也在使用Arrakis进行研究，不过整体员工水平肯定优于Arrakis。另外，与GPT-5相比，Gobi更接近GPT-4.5。

到了10月，FeltSteam再一次表示，一个比GPT-4大100倍的模型即将问世。

GPT-5将在2024年年中，或在2024年第三季度发布。

最近BussinessInsider的报道称，知情人士透露，GPT-5或将在今年夏天发布。与FeltSteam预测的时间几乎吻合。

而Arrakis是GPT-5一个更强大的候选者，在多个领域具备人类水平的专业知识能力。

GPT-5不是AGI

不过，Arrakis并不符合Altman对AGI的定义，即解决「量子引力」的问题。

量子引力，又称量子重力，是描述对重力场进行量子化的理论，属于万有理论之一隅；主要尝试结合广义相对论与量子力学，为当前物理学尚未解决的问题

但正如之前所说，Arrakis模型还是能够达到人类专家水平。

GPT-5和GPT-6都不是AGI

FeltSteam表示，传说中的AGI，是Arrakis以外的东西。

但是，为什么我们能在这么短的时间里，训练出一个125万亿参数的模型呢？

理论上来说，如果训一个1.75万亿参数模型需要4-5个月，那么如果训练一个大百倍的模型，应该需要几十年。

（目前已知，GPT-4在A100集群上训了100天，但是在训练之后，OpenAI又花了几个月时间对它微调和对齐。）

显然，要训125万亿参数的模型，不仅要投入原始计算资源，还要显著提高计算效率。

用90%合成数据训练

另一个比较值得关注的信息是，据称Arrakis去年训练的数据集中约90%是合成数据。

此前，外媒报道称：

Ilya Sutskever的突破让OpenAI克服了在获取高质量数据以训练新模型方面的限制，而这正是开发下一代模型的主要障碍。这项研究涉及使用计算机生成的数据，而不是真实世界的数据，如从互联网上提取的文本或图像来训练新模型。

FeltSteam认为，OpenAI正遇到了扩展（scaling）的难题，因为仅仅扩展注意力和模型参数是远远不够的。

目前，GPT-4的训练已经穷尽了整个互联网的数据，还需要进行强化学习，甚至更多的数据。

另外，Arrakis还是一个非常出色的自主智能体。

所有关于OpenAI项目信息汇总目录一览表。

十万个H100训GPT-6，被电力卡脖子

就在以上的爆料帖中，有一种说法是，GPT-6将于2025年发布。

而就在爆料微软工程师对话的帖子中，也再次证实：微软正用10万个H100来帮OpenAI训练GPT-6！

有网友算了一下，如果十万个H100同时开启，功耗将达到70兆瓦，电网肯定撑不住。

而熟悉电力行业的网友说，一般大型电厂的输出功率将达到2000兆瓦，100兆瓦的负载其实并不大。但是突然在电网中增加100兆瓦的负载肯定会让电网系统出问题。

核能也许是唯一的办法了，电力短缺将直接限制未来GPU的发展。

此前，ChatGPT每天耗电已超50万千瓦时，登上了热搜，足见AI「吃电」非常凶猛。

根据波士顿咨询集团的分析，到2030年，数据中心的用电量预计将增加两倍，相当于为大约4000万美国家庭供电所需的电力量

没想到，马斯克预言的由AI导致的电力短缺，这么快就卡住AGI的脖子了。

马斯克：「现在AI对算力的需求差不多每半年就会增加10倍，马上会超过宇宙的质量。芯片短缺缓解后，马上就会出现电力短缺。如果电网输出100-300千伏的电压，然后必须一路降压至6伏，未来会出现变压器短缺」。

包括Sam Altman在内的越来越多的AI行业大佬表示，AI的第一性原理，最重要的部分就是能源和智能的转化率的问题。

而人工智能是能源的无底洞，AI未来将会被能源卡脖子。

因为Transformer本质上不是一个能效很高的算法，所以在未来，能源将会是困扰AI发展的一个大问题。

对此，网友们表示，长期看好中国基建。

而在Altman看来，满足AI飙升能源需求的最有效方法，就是核聚变。

为此，他本人就在核聚变上投资了真金白银的数亿美元。

没有突破，就没有办法到达那里，我们需要核聚变。

然而，真要达成核聚变，却没那么快。

英国曼彻斯特大学核聚变研究员Aneeqa Khan表示，“在地球上重建太阳中心的条件是一个巨大的挑战”，可能要到本世纪下半叶才能准备就绪。

「核聚变已经为时已晚，无法应对气候危机。在短期内，我们可利用的是现有的低碳技术，比如裂变和可再生能源」。

国际能源署（IEA）最近的一项分析计算出，数据中心、某货和人工智能的电力消耗在未来两年内可能会翻一番。2022年，它们约占全球电力需求的2%。同时AI的需求将呈指数级增长，在2023年至2026年间至少增长10倍

此外，除了电力的限制之外，网友还继续脑洞大开，认为散热也将成为一个问题。🐶

10万块H100还会带来散热和空间堆叠的问题，其实最近3年这些问题一直都存在，未来还会越来越严重。

网友进一步调侃到，未来加拿大会成为AI大国，因为他们有取之不尽的寒冷且干燥的空气！这些在AI时代将会是宝贵的自然资源。

参考资料：

https://x.com/ai_for_success/status/1772701538705617167?s=20

https://twitter.com/ai_for_success/status/1772492362872168656?t=VDn6nXceeqOAuRZYi58vgA&s=19

于政治课来说，高一需要好好听课，政治是任何一个学段都要考试的学科，而且是必学，大学是公共课，大学毕业了考公也和政治密切相关，考研也要考，读博也有政治考核，这个政治和英语一样，可以不高，但是也必须合格，这是我们的国情决定的。初中政治是政治入门的基础，除了在应试上就有很大的价值，对个人三观的形成也有很大的影响，学习政治不能简单的听，更重要的是思考，思考多了会对你有很大的帮助，所以要好好学习政治，在课堂学习的基础上进行思考。这是学姐整理的高中政治选择题满分技巧已经有很多同学领到并且打印下来了，都说很好用 [

木木不吃香菜l 2024-12-29

年轻人第一辆A8L！奇瑞风云A8L西北大区上市

【陕西汽车在线讯】不试不卖，谁与争锋！12月28日，奇瑞风云A8L西北大区上市暨感恩团购会圆满举办。现场人气鼎沸，捷报频传。活动现场，准车主协亲伴友如约而至，共同见证奇瑞风云A8L在西北大区的上市发布，并在诚意满满的政策下踊跃下订，选购自己的爱车。此次上市活动不仅提升了品牌影响力，也为消费者带来了实实在在的购车优惠，可谓双赢之举。作为奇瑞倾力打造的混动新品，风云A8L搭载鲲鹏超能混动C-DM5.0，拥有“安全节能，一真二实”的核心优势，是当下用户出行的价值优选。风云A8L共推出5款车型，1.5L-DHT

陕西汽车在线 2024-12-29

高考地理答题思路和技巧总结，90分，稳了！

为什么学地理如此重要? 为什么我们需要学习地理，乃至为什么我们喜欢旅行地理学的价值，不仅在于它对科研、决策和规划工作做出了实质性和分析性的贡献。这一学科在培养民众智识、参与感与充实感上，也发挥着重要的基础作用。学习地理使他们更加理解自己在世界上的位置，他们为世界之繁复绮丽感到兴奋，对萍水相逢之人、未曾涉足之地感到好奇。这是学姐整理的高考地理答题思路和技巧总结已经有很多同学领到并且打印下来了，都说很好用 [图片] [图片] [图片] [图片] [图片] [图片]

兔三毛 2024-12-29

RFID设备都离不开它- -固定支架

支架分为多种，通常用到的有以下几种：一/壁挂式支架：这种支架通常用于将读写器或天线安装在墙壁上。它的设计简单而实用，一般由金属或高强度塑料制成。例如，在仓库的入口处，壁挂式支架可以将读写器安装在墙壁合适的高度，方便对进出货物的 RFID 标签进行读取。其安装方式可以是通过膨胀螺栓或者螺丝钉固定在墙壁上，确保读写器或天线的位置稳定。而且，壁挂式支架可以根据实际需要调整角度，使读写器或天线能够更好地覆盖需要读取标签的区域。二/立柱式支架：立柱式支架主要用于在开阔空间或者没有墙壁可供安装的环境中。比如在大型物流

条码刘帮主 2024-12-29

1 系统的服务内容 1.1 服务目标 1.2 信息资产统计服务 1.3 网络、安全系统运维服务 1.4 主机、存储系统运维服务 1.5 数据库系统运维服务 1.6 中间件运维服务 2 运维服务流程 3 服务管理制度规范 3.1 服务时间 3.2 行为规范 3.3 现场服务支持规范 3.4 问题记录规范 4 应急服务响应措施 4.1 应急基本流程 4.2 预防措施 4.3 突发事件应急策略软件项目所有资料集：获取和学习所有资料 [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片]

代码世界数星星 2024-12-29

截齿材质42CrMo的性能分析及比较

在截齿的选择中，材料的选择至关重要。不同的材质具有不同的机械性能和适用范围，因此选择合适的材质可以显著提升截齿的使用寿命和工作效率。42CrMo是一种常用的合金钢材质，广泛应用于制造高强度、高耐磨性的机械设备零件。然而，是否42CrMo就比其他材质更好，需要根据具体的应用场景和需求来判断。 1. 42CrMo材质的特点42CrMo（中国标准）是一种中碳合金钢，主要成分包括碳（C）、铬（Cr）、钼（Mo）和锰（Mn）。它的具体特点如下：高硬度：经过适当的热处理后，42CrMo的硬度可以达到50-55HRC

都尔伯特截齿 2024-12-29

OpenAI把微软电网搞崩！GPT-6被曝25年发布，训练刷爆10万张H100

推荐体验

相关资讯