当前位置：首页|资讯|GPT-4|OpenAI

GPT-4 模型架构泄露：包含 1.8 万亿参数、采用混合专家模型

作者：IT之家发布时间：2023-07-13

GPT-4 模型架构泄露：包含 1.8 万亿参数、采用混合专家模型

IT之家 7 月 13 日消息，外媒 Semianalysis 近日对 OpenAI 今年 3 月发布的 GPT-4 大模型进行了揭秘，其中包括 GPT-4 模型架构、训练和推理的基础设施、参数量、训练数据集、token 数、成本、混合专家模型（Mixture of Experts）等具体的参数和信息。

▲ 图源 Semianalysis

外媒表示，GPT-4 在 120 层中总共包含了 1.8 万亿参数，而 GPT-3 只有约 1750 亿个参数。而为了保持合理的成本，OpenAI 采用混合专家模型来进行构建。

IT之家注：混合专家模型（Mixture of Experts）是一种神经网络，该系统根据数据进行分离训练多个模型，在各模型输出后，系统将这些模型整合输出为一个单独的任务。

▲ 图源 Semianalysis

据悉，GPT-4 使用了 16 个混合专家模型 (mixture of experts)，每个有 1110 亿个参数，每次前向传递路由经过两个专家模型。

此外，它有 550 亿个共享注意力参数，使用了包含 13 万亿 tokens 的数据集训练，tokens 不是唯一的，根据迭代次数计算为更多的 tokens。

GPT-4 预训练阶段的上下文长度为 8k，32k 版本是对 8k 微调的结果，训练成本相当高，外媒表示，8x H100 也无法以每秒 33.33 个 Token 的速度提供所需的密集参数模型，因此训练该模型需要导致极高的推理成本，以 H100 物理机每小时 1 美元计算，那么一次的训练成本就高达 6300 万美元（约 4.51 亿元人民币）。

对此，OpenAI 选择使用云端的 A100 GPU 训练模型，将最终训练成本降至 2150 万美元（约 1.54 亿元人民币）左右，用稍微更长的时间，降低了训练成本。

推荐体验

相关资讯

谷歌Bard更新中文支持；GPT-4：1.8万亿参数、混合专家模型揭秘

AI新闻谷歌的AI聊天工具Bard更新，增加中文支持摘要：谷歌的AI聊天工具Bard新增中文环境，用户可以使用简体和繁体中文进行交流。然而，与竞品相比，Bard的回复略显生硬，语义理解还有待提升。此外，谷歌还更新了Bard的日志页面，新增了40多种语言支持，并增加了与Bard对话时上传图片和文字的功能。此外，用户还可以使用文字转语音功能，固定对话、整理对话，并分享Bard对话内容。对于需要微调Bard回答的用户，还提供了5个选项来修改回答内容。谷歌Bard AI目前处于测试阶段，用户只需使用谷歌账号登录

谷歌 Bard GPT-4 AI聊天机器人

AiBard123工具导航 2023-07-14

GPT-4内幕大泄露1.8万亿巨量参数13万亿token训练斥资6300万美元

。就在刚刚，OpenAI的GPT-4又被业内人士「开源」了！其中包括GPT-4的架构、训练和推理的基础设施、参数量、训练数据集、token数、成本、混合专家模型（Mixture of Experts，MoE）等非常具体的参数和信息。尤其是，在不同工程背后，OpenAI究竟是怎样权衡的。以及在巨型模型推理时，如何跨越其中最大的瓶颈。如此重磅的爆料，出自何许人也？文章作者，是SemiAnalysis的两位名叫Dylan Patel和Gerald Wong的撰稿人。值得一提的是，此前曾在业内引起轩然大

一起学chatGPT一起学ai 2023-07-11

GPT-4内幕大泄露，1.8万亿巨量参数，13万亿token训练，斥资6300万美元

很多企业都能做出GPT-4

新智元 2023-07-11

GPT-4模型架构泄露，中国大模型创业能否突出重围？

业内人士近日对OpenAI今年3月发布的GPT-4大模型进行了大揭秘，其中包括GPT-4模型架构、训练和推理的基础设施、参数量、训练数据集、token数、成本、混合专家模型(MixtureofExperts,…

OSC开源社区 2023-07-17

GPT-4：拥有1.8万亿巨量参数，13万亿token训练，花费6300万美元的AI巨头

在人工智能领域，GPT-4无疑是一款重量级模型，其拥有1.8万亿巨量参数，13万亿token的训练数据，以及OpenAI公司花费的6300万美元的研发成本。GPT-4是一种自然语言处理（NLP）模型，

GPT-4 人工智能 OpenAI

成都嗨创科技有限公司 2023-07-11

近期资讯

湖北盈锋能源取得电缆加工用等长切割装置专利，能对电缆长度进行测量

金融界2024年12月25日消息，国家知识产权局信息显示，湖北盈锋能源集团有限公司取得一项名为“一种电缆加工用的等长切割装置”的专利，授权公告号CN222198734U，申请日期为2024年5月。

金融界 2024-12-25

如何有效处理手机病毒问题，确保信息安全与使用顺畅

录、照片、银行信息等等，一旦被盗取，后果可不堪设想。如果你已经按照上面的方法处理过手机，但问题依然没有解决，或者手机出现了更严重的故障，比如频繁重启、无法开机等，这时候可能就需要专业的技术支持了。遇到问题不要慌张，冷静应对，往往能找到解决的办法。

新报观察 2024-12-25

江西兄弟医药申请一种碘美普尔杂质I的制备方法专利，解决碘美普尔在生产、检测过程中的控制限度定量

金融界2024年12月25日消息，国家知识产权局信息显示，江西兄弟医药有限公司申请一项名为“一种碘美普尔杂质I的制备方法”的专利，公开号CN119176785A，申请日期为2023年12月。

金融界 2024-12-25

掌握五笔输入法的技巧与练习方法，快速提升打字速度与准确性

五笔输入法是一种非常流行的汉字输入方式，很多人用它来提高打字速度。五笔的键盘布局与普通的拼音输入法有所不同，掌握这些布局是非常重要的。

新报观察 2024-12-25

杜邦特种材料韩国有限公司申请多种主体材料专利，提供具有低驱动电压等特征的有机电致发光装置

金融界2024年12月25日消息，国家知识产权局信息显示，杜邦特种材料韩国有限公司申请一项名为“多种主体材料、有机电致发光化合物及包含其的有机电致发光装置”的专利，公开号CN119176788A，申请日期为2024年6月。专利摘要显示，本公开涉及多种主体材料有机电致发光化合物以及包含其的有机电致发光装置。

金融界 2024-12-25

西安欧得申请一种三苯甲基稠环类衍生物及其电致发光器件专利，能有效提高器件的发光效率和使用寿命

金融界2024年12月25日消息，国家知识产权局信息显示，西安欧得光电材料有限公司申请一项名为“一种三苯甲基稠环类衍生物及其电致发光器件”的专利，公开号CN119176790A，申请日期为2024年11月。

金融界 2024-12-25

如何安全地关闭电脑开机密码，提升使用便捷性？

关闭电脑开机密码其实是个很简单的过程，尤其是在你觉得没有必要每次开机都输入密码的时候。不过，在我们开始之前，得提醒你一下，关闭开机密码虽然方便，但安全性就会下降，尤其是如果你的电脑上存有重要的个人信息或者工作资料的话。

新报观察 2024-12-25

如何通过手机轻松控制电视，享受便捷的娱乐体验

在这个科技飞速发展的时代，手机已经成为我们生活中不可或缺的一部分。没错，今天我们就来聊聊怎么用手机开电视，带你体验一下这种便捷的生活方式。首先，想要用手机开电视，最重要的一步就是确保你的手机和电视能够连接。

新报观察 2024-12-25

如何设置个性化来电图片，让每次来电更具温暖与惊喜

在这个信息化的时代，手机已经成为我们生活中不可或缺的一部分。除了打电话、发信息，手机的个性化设置也越来越受到大家的关注。今天，我们就来聊聊如何设置来电图片，让你的手机在响起时更加独特和个性。想必大家都有这样的经历，当手机响起时，看到来电显示的名字，心里总会有种期待感。但是，如果能在来电时看到一张熟悉的照片，那种感觉就会更加强烈。

新报观察 2024-12-25

天津特变线缆取得铝合金电缆生产用截断装置专利，避免电缆在截断时移动影响精度

金融界2024年12月25日消息，国家知识产权局信息显示，天津特变线缆有限公司取得一项名为“一种铝合金电缆生产用截断装置”的专利，授权公告号CN222198733U，申请日期为2024年4月。

金融界 2024-12-25

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1