当前位置：首页|资讯|GPT-4

George Hotz 爆料 GPT-4 由 8 个 MoE 模型组成

作者：Metaverse漫游发布时间：2023-06-26

据报道，美国知名骇客George Hotz在接受采访时透露，GPT-4由8个220B模型组成。就连PyTorch的创建者Soumith Chintala对此也深信不疑。GPT-4：8 x 220B专家模型用不同的数据/任务分布和16-iter推理进行训练。如果真是这样的话，GPT-4的训练可能更加有效。

George说是八个模型推理十六次，应该是每个模型都参与了推理。所以不可能是猜想三路由到不同的模型。

令人失望的是Open AI没有做出路线上的重大突破，而只是技术上的一些突破，跟很多人的预期完全不一致，和MOE架构本身能不能在未来继续提升表现关系不大，「同一个模型训 8 次」的信息，搞得应该不是这样的。而且做 16 次 inference 的做法显然说明省 inference 不是非常前位的目的。

但至少两个 high profile 的人都出来说是 8x 220B on different data，基本上说明了主架构不是 sparse activation 的 router 类的 moe，而可能是 parallel inference 然后 ensemble 或者 vote 之类的。

万一不是MoE而是别的啥黑科技大火箭，现在大家相信是了MoE，结果全部走上了弯道，OpenAI雄霸数十载。

如果再用这个混合集合生成的数据去喂新的base，再反复迭代持续，后面的效果会越来越好，提升空间很大，而且方便扩展和持续迭代。

类似当年围棋实现AI和AI下棋，不断迭代，人类就彻底赶不上了。

推荐体验

相关资讯

黑客 George Hotz 爆料 GPT-4 由 8 个 MoE 模型组成，真的吗？

用MoE完全意料之中，也是未来必经的方向之一。出乎意料的是在GPT-4阶段OpenAI就在尝试MoE了，这可能预示着算力比想象中更紧张。为何MoE之类是必经方向呢？因为从第一性原理思考，类GPT-3

蓬域科技 2023-06-25

GPT-4：揭秘黑客 George Hotz 的爆料

近日，黑客乔治·霍茨的一则爆料引起广泛关注。他声称即将推出的GPT-4将由8个MoE（专家混合）模型组成。这一消息在人工智能领域引起了轰动，所以让我们来揭开这一引人注目的声明的神秘面纱。文：GPT

GPT-4 人工智能

小记青春 2023-06-30

GPT-4参数最新爆料！1.76万亿参数，8个2200亿MoE模型，深信不疑

家人们，GPT-4的参数可能还真不止1万亿！近来，美国知名骇客George Hotz在接受采访时透露，GPT-4由8个220B模型组成。这么算来，8 x 220B = 1.76万亿。就连PyTorch的创建者Soumith Chintala对此也深信不疑。GPT-4：8 x 220B专家模型用不同的数据/任务分布和16-iter推理进行训练。如果真是这样的话，GPT-4的训练可能更加有效。1.76万亿「八头蛇」？在GPT-4还未放出之前，GPT-3有1750亿个参数，一众网友猜测GPT-4岂不是

一起学chatGPT一起学ai 2023-06-21

GPT-4参数最新爆料，1.76万亿参数，8个2200亿MoE模型，PyTorch创始人深信不疑

1.76万亿「八头蛇」？

新智元 2023-06-21

如果建立一个由AI组成的公民社会……

你有没有想过，如果我们建立一个完全由AI组成的公民社会团体，让它们模仿人类的文明发展，那么这个AI社会最终将会进化到何种文明程度？需要明确的是AI社会只有AI，没有人类，完全是AI之间互相沟通交流，进行社会的文明发展。按照目前AI技术的发展，已经满足了做这种实验的大部分条件，比如ChatGPT、GPT4、AutoGPT这类大语言模型可以给每个AI机器人赋予语言和逻辑能力，而Dall e2这类模型可以单独赋予AI作画的能力，视觉模型就比较多了，可以随意选择，类似的Yolo系列模型都可以。当然要做这件事情，有

ChatGPT GPT-4 AutoGPT 大语言模型

深度智谷 2023-04-25

近期资讯

【OpenHarmony】鸿蒙 UI动画开发之lottieArkTS

lottie是一个适用于OpenHarmony的动画库，它可以解析Adobe After Effects软件通过Bodymovin插件导出的json格式的动画，并在移动设备上进行本地渲染。

塞尔维亚大汉 2024-12-30

对标理想L9！零跑全新大型SUV伪装车曝光：有望命名C18

快科技12月30日消息，网络上最近曝光了零跑汽车的一款全新大型SUV伪装实车图。据悉，这款车可能被命名为“C18”，并且尺寸将超过现有的C16车型。零跑汽车目前的产品线包括C01、

2024-12-30

老外评选年度10大游戏：《黑神话》《宇宙机器人》前三

在2024年即将结束的时候，外媒“GameRant”也在年末的关卡，公布了由该媒体机构评选出的10大年度游戏。其中《黑神话：悟空》和TGA 2024年度游戏《宇宙机器人》均进入了前三名的位

2024-12-30

鸿蒙开发：自定义一个车牌字母键盘

车牌字母键盘和一般的键盘还有很大区别的，大家可以发现，键盘上是少一个字母的，因为I字母具有混淆性，所以这个字母是不在车牌键盘内的。

程序员一鸣 2024-12-30

Android U WMS: 近期任务动画(2)

为了不把“战线”拉得太长，上一篇文章省略了 fixed rotation 的分析，本文就重点分析这个。 fixed rotation 由于是从一个横屏的 app 返回竖屏的桌面，这里利用 launch

大胃粥 2024-12-30

鸿蒙开发：文本合成语音

在鸿蒙当中，如何实现根据指定的文本进行合成语音合成播放呢，其实也是非常的简单，因为鸿蒙当中也有textToSpeech。

程序员一鸣 2024-12-30

C#/.NET/.NET Core技术前沿周刊 | 第 19 期（2024年12.23-12.29）

前言 C#/.NET/.NET Core技术前沿周刊，你的每周技术指南针！记录、追踪C#/.NET/.NET Core领域、生态的每周最新、最实用、最有价值的技术文章、社区动态、优质项目和学习资源等。

追逐时光者 2024-12-30

摇粒绒内胆：贵人鸟三合一冲锋衣109元新低（单夹克99元）

天猫贵人鸟户外旗舰店，贵人鸟三合一冲锋衣日常售价409元，下单可领300 元限时券，实付109元到手。连帽可拆卸三合一、石墨烯涂层三合一款此价，另有单夹克款99元可选。共有18款可选。防泼水

2024-12-30

解锁AI潜力：AI在销售领域的应用案例(非Chatbot)

作者 | Shaw Talebi 编译 | 岳扬客户向我提出的最常见需求是“为我打造一个专属的聊天机器人。”虽然这种需求是解决某些问题的好办法，但远不是万能的。在本篇文章中，我将分享企业可以利用

Baihai_IDP 2024-12-30

揭秘华为南方工厂打造高端存储的奥秘：可靠性7个9！

快科技12月30日消息，今日，华为数据存储公众号发文，揭秘了华为南方工厂打造高端存储的奥秘——可靠性7个9如何达成。据介绍，7个9代表着年意外停机时间不超过3秒，作为存放企业关键

2024-12-30

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1