人手一个专属ChatGPT？微软开源“傻瓜式”工具训练速度提升15倍

作者：财联社发布时间：2023-04-13

ChatGPT 微软

《科创板日报》4月13日讯（编辑郑远方）当地时间4月12日，微软宣布开源DeepSpeed-Chat，帮助用户轻松训练类ChatGPT等大语言模型，人人都有望拥有专属ChatGPT。

OpenAI之前明确表示拒绝开源GPT-4，也收获了无数“OpenAI并不open”的吐槽。而AI开源社区已推出LLaMa、Vicuna、Alpaca等多个模型，帮助开发者开发类ChatGPT模型。

即便如此，现有解决方案下训练数千亿参数的最先进类ChatGPT模型依旧困难，主要瓶颈便在于缺乏RLHF训练普及——而微软本次开源的DeepSpeed-Chat，便补齐了最后这一块“短板”，帮助在模型训练中加入完整RLHF流程的系统框架。

仅需一个脚本，便可以完成RLHF训练的全部三个阶段，类ChatGPT大语言模型生成唾手可得，堪称“傻瓜式操作”。

图|DeepSpeed-Chat的RLHF 训练流程图示，包含了一些可选择功能（来源：微软）

这还不是DeepSpeed-Chat唯一的优势，微软提供了中、英、日三语文档，作出了详细介绍。总体来说，其核心功能与性能包括：

1. 简化类ChatGPT模型训练、强化推理体验。

2. DeepSpeed-RLHF模块复刻了InstructGPT论文中的训练模式。同时，DeepSpeed将训练引擎与推理引擎共同整合到了一个统一混合引擎用于RLHF训练。

3. 高效性和经济性：可将训练速度提升15倍以上，并大幅度降低成本。例如，DeepSpeed-HE若在Azure云上训练一个OPT-30B模型，仅需18小时、花费不到300美元。

4. 卓越的扩展性：可支持训练数千亿参数模型，并在多节点多GPU系统上扩展性突出，只需1.25小时就可完成训练一个130亿参数模型。

5. 实现RLHF训练普及化：仅凭单个GPU，DeepSpeed-HE就能支持训练超过130亿参数的模型。因此无法使用多GPU系统的数据科学家和研究者，不仅能创建轻量级RLHF模型，还能创建大型且功能强大的模型。

此外，与Colossal-AI、HuggingFace等其他RLHF系统相比，DeepSpeed-RLHF在系统性能和模型可扩展性方面表现出色：

就吞吐量而言，DeepSpeed在单个GPU上的RLHF训练中实现10倍以上改进；多GPU设置中，则比Colossal-AI快6-19倍，比HuggingFace DDP快1.4-10.5倍。

就模型可扩展性而言，Colossal-AI可在单个GPU上运行最大1.3B的模型，在单个A100 40G 节点上运行6.7B的模型，而在相同的硬件上，DeepSpeed-HE可分别运行6.5B和50B模型，实现高达7.5倍提升。

因此，凭借超过一个数量级的更高吞吐量，DeepSpeed-RLHF比Colossal-AI、HuggingFace，可在相同时间预算下训练更大的actor模型，或以1/10的成本训练类似大小的模型

（科创板日报郑远方）

相关资讯

微软开源“傻瓜式”类ChatGPT模型训练工具，速度提升15倍

当地时间 4 月 12 日，微软宣布开源 DeepSpeed-Chat，帮助用户轻松训练类 ChatGPT 等大语言模型。据悉，Deep Speed Chat 是基于微软 Deep Speed 深

微软 ChatGPT

学术头条 2023-04-13

微软开源“傻瓜式”类ChatGPT模型训练工具，成本大大降低，速度提升15倍

训练一个130亿参数的类ChatGPT模型，只需要1.25小时。

微软 ChatGPT

学术头条 2023-04-13

微软开源Deep Speed Chat 可将训练速度提升15倍以上

北京商报讯（记者杨月涵）当地时间4月12日，微软宣布开源DeepSpeedChat，帮助用户训练类ChatGPT等大语言模型。据了解，DeepSpeedChat基于微软DeepSpeed深度学习优化库开发，具备训练、强化推理等功能，使用RLHF（人工反馈机制的强化学习）技术，可将训练速度提升15倍以上，并大幅降低成本。

微软 ChatGPT 人工智能

北京商报 2023-04-13

喝杯咖啡就能训练大模型？微软开源项目将训练速度提升15倍

4月13日，微软宣布开源DeepSpeed-Chat，号称可以通过这一项目将ChatGPT等大语言模型的训练速度提升15倍以上，并大幅降低成本。千亿参数的ChatGPT初始所需的算力就需要1万块当前最先进的AI芯片，英伟达A100来提供，成本高达1亿美元，而就算是训练一个参数不超百亿的类ChatGPT模型，也仍需要高成本的GPU集群。

微软英伟达 ChatGPT AI芯片

南方都市报 2023-04-14

以后人手一个ChatGPT？微软宣布开源大模型训练神器

Deep Speed Chat的最大优势，是它可以大幅提升训练速度和降低训练成本。据微软称，Deep Speed Chat可以在一块GPU上训练高达130亿参数的对话模型，或者在Azure云上以300美元的费用训练同样规模的模型。

ChatGPT 微软

元宇宙简史 2023-04-14

人手一个专属ChatGPT？微软开源“傻瓜式”工具训练速度提升15倍

推荐体验

相关资讯

微软开源“傻瓜式”类ChatGPT模型训练工具，速度提升15倍

微软开源“傻瓜式”类ChatGPT模型训练工具，成本大大降低，速度提升15倍

微软开源Deep Speed Chat 可将训练速度提升15倍以上

喝杯咖啡就能训练大模型？微软开源项目将训练速度提升15倍

以后人手一个ChatGPT？微软宣布开源大模型训练神器

近期资讯

浙江浙能嘉华发电有限公司取得粉尘电荷量检测装置专利，实现定向定位

如何高效使用 QQ：从下载注册到聊天功能全解析

如何轻松查看和管理电脑基本信息的实用指南

如何有效管理电话黑名单，保护隐私与安全的实用指南

山东泰开自动化取得交流剩余电流监测装置专利，可实现快速排热

海克斯康制造智能技术（青岛）有限公司取得三坐标测量机可转动夹具专利，提高测量效率

极瞳生命科技取得表面等离子共振检测系统专利，切换方便操作简单

如何有效解决手机充不进电的问题及其预防措施

广东省安心加科技有限公司取得一种建筑造价测距仪专利，提高测距仪本体的使用寿命

如何高效删除PDF文件中的不需要页面：工具与方法指南

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

人手一个专属ChatGPT？微软开源“傻瓜式”工具 训练速度提升15倍

人手一个专属ChatGPT？微软开源“傻瓜式”工具训练速度提升15倍