当前位置：首页|资讯|GPT-4|OpenAI

黑客 George Hotz 爆料 GPT-4 由 8 个 MoE 模型组成，真的吗？

作者：蓬域科技发布时间：2023-06-25

用MoE完全意料之中，也是未来必经的方向之一。出乎意料的是在GPT-4阶段OpenAI就在尝试MoE了，这可能预示着算力比想象中更紧张。

为何MoE之类是必经方向呢？因为从第一性原理思考，类GPT-3的架构有着以下矛盾：

模型的性能随着模型的大小提升，模型的serving的flops正比于模型大小

对于一家公司而言，最大的开销并不是训练，而是之后长期的服务开销：训练是一次性的东西，而服务对算力的要求是无穷无尽的。由此一种策略就显而易见了：模型serving的flops要低于训练时的flops。MoE就是一个很显然的选择，可以保证稀疏激活。如果要在自然界找证据，人的大脑也有着类似的设计：功能分区，稀疏激活。

然而，就算如此，GPT-4的服务能力仍然是个瓶颈。所以OpenAI近期不会考虑GPT-5，毕竟即使训练出来也很难做服务，且很难说GPT-4的性能已经被充分挖掘了。OpenAI正在做的可能是相反的事情：推出一个GPT-4的turbo版本。

推荐体验

相关资讯

George Hotz 爆料 GPT-4 由 8 个 MoE 模型组成

据报道，美国知名骇客George Hotz在接受采访时透露，GPT-4由8个220B模型组成。就连PyTorch的创建者Soumith Chintala对此也深信不疑。GPT-4：8 x 220B专家

Metaverse漫游 2023-06-26

GPT-4：揭秘黑客 George Hotz 的爆料

近日，黑客乔治·霍茨的一则爆料引起广泛关注。他声称即将推出的GPT-4将由8个MoE（专家混合）模型组成。这一消息在人工智能领域引起了轰动，所以让我们来揭开这一引人注目的声明的神秘面纱。文：GPT

GPT-4 人工智能

小记青春 2023-06-30

GPT-4参数最新爆料！1.76万亿参数，8个2200亿MoE模型，深信不疑

家人们，GPT-4的参数可能还真不止1万亿！近来，美国知名骇客George Hotz在接受采访时透露，GPT-4由8个220B模型组成。这么算来，8 x 220B = 1.76万亿。就连PyTorch的创建者Soumith Chintala对此也深信不疑。GPT-4：8 x 220B专家模型用不同的数据/任务分布和16-iter推理进行训练。如果真是这样的话，GPT-4的训练可能更加有效。1.76万亿「八头蛇」？在GPT-4还未放出之前，GPT-3有1750亿个参数，一众网友猜测GPT-4岂不是

一起学chatGPT一起学ai 2023-06-21

GPT-4参数最新爆料，1.76万亿参数，8个2200亿MoE模型，PyTorch创始人深信不疑

1.76万亿「八头蛇」？

新智元 2023-06-21

Google 史上最强大模型 Gemini，真的全面「碾压」GPT-4 吗？

昨天深夜，Google突然发布重磅AI杀手锏——Gemini。多模态Gemini可以理解、操作和结合不同类型的信息，包括文本、代码、音频、图像和视频。在去年ChatGPT发布不到两周后，Google就已经拉响「红色警报」来应对挑战。可紧急上线的Bard，却在首次亮相就出现错误，一夜让Google蒸发了1000亿美元市值。

谷歌 GPT-4 ChatGPT Bard 编程

爱范儿 2023-12-07

近期资讯

🔥《手把手教你》系列基础篇之2-python+ selenium自动化测试-打开和关闭浏览器（详细）

首先宏哥要拉一下票，希望喜欢宏哥的支持一下，投下你宝贵的6票，投票完成记得抽奖哈，灰常感谢！！！掘金2024年度人气创作者打榜中，快来帮我打榜吧～ activity.juejin.cn/rank

北京_宏哥 2024-12-27

Logstash 安装与部署（无坑版）

下载版本对照关系：ElasticSearch 7.9.2 和 Logstash 7.9.2 ；官方下载地址选择ElasticSearch版本一致的Logstash版本 https://www.e

不惑_ 2024-12-27

面试官：不会“不定高”虚拟列表，你在简历上面提他干嘛？

很多同学将虚拟列表当做亮点写在简历上面，但是却不知道如何手写，那么这个就不是加分项而是减分项了。在上一篇文章欧阳教会你如何实现一个定高虚拟列表，但是实际项目中更多的是不定高虚拟列表，这篇文章欧阳来

前端欧阳 2024-12-27

玩转前端正则表达式

JavaScript中的正则是Perl的大子集，但Perl内部的一些表达式却没有继承正则表达式是用于匹配字符串中字符组合的模式(可参考MDN教程) 一个例子使用正则将一个数字以科学计数法进行表示，

大卫talk 2024-12-27

javascript中的==、===

javascript 中对于不同参数比较经常会碰到 ==、===，而使用过程中一般很多问题都会出现在 ==，因此很多人一般都是无脑使用 === 符号，这个 == 实际应用中如果不是很了解

剪刀石头布啊 2024-12-27

《HelloGitHub》第 105 期

简介 HelloGitHub 分享 GitHub 上有趣、入门级的开源项目。这里有实战项目、入门教程、黑科技、开源书籍、大厂开源项目等，涵盖多种编程语言 Python、Java、Go、C/C++、S

HelloGitHub 2024-12-27

基于Java异步处理的 USB 设备监控系统设计与实现：技术架构与业务场景分析

随着智能设备和物联网技术的快速发展，USB 设备在各行各业中的应用越来越广泛。从工业设备到个人电子产品，USB 设备已经成为数据传输和设备连接的主流方式。然而，设备的动态插拔和状态变化的检

不惑_ 2024-12-27

flex常见内容介绍

flex布局 flex被称为万能布局，叫flex布局，也叫盒子布局，其不单是一个flex属性，它包含了一套新的属性集,属性集包括用于设置容器，和用于设置项目两部分

剪刀石头布啊 2024-12-27

微软强制推广Copilot引反感！用户只能自认倒霉

快科技12月27日消息，据媒体报道，微软近期在推广其人工智能助手Copilot时，采取了一种颇具争议的新策略。在澳大利亚和部分东南亚国家，无论用户是否愿意，微软都将Copilot集成到了消费者订阅

2024-12-27

css滤镜

css 常用滤镜有不少例如：毛玻璃效果、灰色滤镜、阴影滤镜、自定义svg滤镜等，尤其比较常见的就是毛玻璃和滤镜效果了，毛玻璃一般用在背景(z方向底部)模糊，灰色滤镜一般用于清明节主题

剪刀石头布啊 2024-12-27

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1