当前位置：首页|资讯|微软|ChatGPT|编程

如何看待微软最新论文揭秘ChatGPT参数量只有20B?

作者：情爱的你是谁发布时间：2023-11-06

微软 ChatGPT 编程

刚刚简单看了一下原文，原文主要内容还是给出了一类用于代码生成的diffusion model并进行了评测分析，ChatGPT只是作为对比评测的baseline之一引入，对于表格中ChatGPT的20B参数量这个数据怎么得来的似乎没有任何解释或者引用，感觉就是作为一个很显然的已知量给出。

虽然说微软和OpenAI有着千丝万缕联系，微软的研究人员能拿到ChatGPT的详细技术细节也不意外，但终归不是OpenAI的官方开发人员出来澄清，严格来说仅凭这篇文章我们也不能断定ChatGPT就是20B级别模型，可以继续等一波后续OpenAI开发者大会给出更多官方爆料。

不过如果消息属实，其实也并不感到意外，早在今年2月就有外网消息透露ChatGPT是20B级别模型

ChatGPT is not just smaller (20 billion vs. 175 billion parameters) and therefore faster than GPT-3, but it is also more accurate than GPT-3 when solving conversational tasks a perfect business case for a lower cost/better quality AI product.

Is Bigger Better? Why The ChatGPT Vs. GPT-3 Vs. GPT-4 'Battle' Is Just A Family Chat

知乎也有大佬从技术和API价格角度推测了其参数量级大约10B级别

ChatGPT 和 Whisper API 已开放接口，单价骤减 90% ，有哪些值得关注的信息？

对于这个消息，最值得警惕的应该是国内厂商，据我所知目前国内各家公司争先恐后开发的千亿结巴大模型中基本都在使用ChatGPT清洗和标准数据，虽然学术界和业界之前不是没有使用小模型辅助训练大模型的案例，但是大多数都是使用个别领域的专业模型训练通用模型。用一个小参数的通用模型来训练更大规模的通用模型，从直观上来说总觉得不是很make sense

对个人和许多小开发团队来说，可能这也是一件好事，说明模型也不一定是越大越好，知识蒸馏和RLHF等算法、技术依然起到了很大作用，可以让我们在这些方面努力从而在算力不是很充足的情况下依然能做出有价值的成果。

推荐体验

相关资讯

微软最新论文，ChatGPT的参数量只有20B（200亿）

微软在上周四放出来一篇论文，其中实验部分给出了gpt3.5的参数量：只有20B！本文分析了可信度，猜测了对应的技术路线

bastgia 2023-10-31

ChatGPT参数规模被扒：只有7B

ChatGPT参数规模被扒：只有7B 梦晨发自凹非寺量子位公众号 QbitAI ChatGPT惨遭攻击，参数规模终于被扒出来了—— 很可能只有7B（70亿）。消息来自南加州

量子位 2024-03-17

Mixtral 8x7B论文终于来了：架构细节、参数量首次曝光

机器之心报道作者：陈萍、大盘鸡Mixtral8x7B在大多数基准测试中都优于Llama270B和GPT-3.5。此前，由于OpenAI团队一直对GPT-4的参数量和训练细节守口如瓶。

机器之心Pro 2024-01-10

书生·浦语20B模型在阿里云魔搭开源首发

9月20日，上海人工智能实验室等机构发布书生·浦语大模型（InternLM）200亿参数版本InternLM-20B，并在阿里云魔搭社区（ModelScope）开源首发、免费商用。书生·浦语大模型体系与魔搭社区建立重磅生态合作，共同推动中国大模型生态建设。书生·浦语（InternLM）大语言模型由上海人工智能实验室联合多家机构共同推出。2023年6月，InternLM千亿参数（104B）语言大模型首次发布，现已经历多轮升级；7月，上海人工智能实验室开源书生·浦语70亿参数的轻量级版本InternLM-7B，且在业内率先开源贯穿数据、预训练、微调、部署和评测的全链条工具体系。InternLM-7B也已上线魔搭社区。本次发布的InternLM-20B是一款中量级大模型，性能先进且应用便捷，模型基于2.3T Tokens预训练语料从头训练，相较于InternLM-7B，其理解能力、推理能力、数学能力、编程能力等都有显著提升。相比于此前国内陆续开源的7B和13B规格模型，20B量级模型具备更强大的综合能力，复杂推理和反思能力尤为突出，能为实际应用场景提供更有力的性能支持；同时，20B量级模型可在单卡上进行推理，经过低比特量化后，可运行在单块消费级GPU上，因而在实际应用中更为便捷。

人工智能大语言模型

2023-09-20

CNS最新论文导读（12月22日）

人工智能论文标题：Autonomous chemical research with large language models 期刊：Nature ( IF 64.8 ) 发表时间：2023/12/20 惟小研导读：这项研究介绍了基于Transformer的大型语言模型在自然语言处理、生物学、化学和计算机编程等领域取得的显著进展。研究团队展示了Coscientist，这是一个由GPT-4驱动的人工智能系统，通过整合强大的语言模型和工具（如互联网和文档搜索、代码执行以及实验自动化），能够自主设计、规划

人工智能大语言模型编程 GPT-4

惟研 2023-12-22

近期资讯

男女款齐全：红妮磨绒保暖内衣套装49元大促（日常109元）

天猫【红妮旗舰店】红妮中厚磨绒保暖内衣套装日常售价为 109 元，下单领取 60 元优惠券，到手价为 49 元。购买链接：天猫(券后49元)男女款共有 15 款可选择，包含圆领 / 随心裁圆领 / 随心

2024-12-28

OpenHarmony UI动画-recyclerview_animators

controller: RecyclerView.Controller = new RecyclerView.Controller() 设置列表整体效果类型 this.controller.setA

别说我什么都不会 2024-12-27

日本制造信仰崩塌！多家百年日企又承认造假就是故意的

快科技12月28日消息，日本不少老牌企业公然造假，让日本制造彻底颜面扫地。据国外媒体报道称，日本知名企业松下公司表示，其部分商用空调产品有关空调性能的数据造假。松下称，2012-2024年，

2024-12-28

基于大模型技术构建的 GitHub Assistant

PeterCat，一个专注于开源项目答疑的智能助手。想给你的 GitHub 仓库添个机器人，又烦透了主流 Agent 平台繁琐的表单流程？在 PeterCat 中一键粘贴项目地址即可，配置自动生成，知

嘤嘤嘤 2024-12-27

《手把手教你》系列基础篇之（一）-java+ selenium自动化测试-环境搭建（上）（详细教程）

打榜首先宏哥要拉一下票，希望喜欢宏哥的支持一下，投下你宝贵的6票，投票完成记得抽奖哈，灰常感谢！！！掘金2024年度人气创作者打榜中，快来帮我打榜吧～ activity.juejin.cn/rank

北京_宏哥 2024-12-28

智界R7车主调研报告出炉：“华为”成金字招牌

快科技12月28日消息，由华为和奇瑞共同打造的智界品牌第二款车型R7已经上市，该车销量非常相当好，当前已经交付超过2万辆。近日，媒体“42号车库”调研了100名智界R7的车主（准车

2024-12-28

如何用WPS AI提高工作效率

对于每位职场人而言，与Word、Excel和PPT打交道几乎成为日常工作中不可或缺的一部分。在办公软件的选择上，国外以Office为代表，而在国内，WPS则是不可忽视的一大选择。当年一代天才程序员求伯

栈江湖 2024-12-27

《手把手教你》系列基础篇之（二）-java+ selenium自动化测试-环境搭建（下）基于Maven（详细教程）

打榜首先宏哥要拉一下票，希望喜欢宏哥的支持一下，投下你宝贵的6票，投票完成记得抽奖哈，灰常感谢！！！掘金2024年度人气创作者打榜中，快来帮我打榜吧～ activity.juejin.cn/rank

北京_宏哥 2024-12-28

Android图形框架之SurfaceComposerClient 提交事务过程

0 前言在Android图形框架之SurfaceControl 构建过程分析一文中，我们了解到了创建一个SurfaceControl的过程，其实这个过程创建了一个Surface以及一个Layer。接

FerdinandHu 2024-12-27

怕冷的人VS抗冻的人：哪个更健康

随着气温逐渐下降，有人裹着厚厚的羽绒服仍旧冷得发抖，有人却穿着单衣在寒风中悠然自得。这不禁让人好奇：为什么有人这么抗冻？怕冷和抗冻是否暗示着身体的健康状况？今天我们就来聊聊这两类

2024-12-28

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1