当前位置：首页|资讯|源大模型|编程|ChatGPT

从零实现BERT、GPT及Difussion类算法：文章简介及目录

作者：一代闲人发布时间：2023-04-22

源大模型编程 ChatGPT

本教程特点：

除了python基础库和pytorch基础运算外，不借助其他第三方库
从零推导、实现Transformer及Bert、GPT、Diffusion等热门模型
从零实现data parallel、tensor parallel、pipeline parallel等并行训练策略
借助开源大模型权重，从零实现SFT+RLHF的训练、部署

平时工作忙，如果有同学有精力和意愿来一起完善代码和教程，欢迎私信联系

随着Transformer在文本、图像等领域的应用，以及ChatGPT的爆火，可以说只要掌握了基础算法知识和Transformer，几乎能开发出任意AI算法。但是huggingface的Transformers有很多稳定性代码导致学习成本太高，所以打算从头写一写Transformer及bert、gpt、diffusion（up主自己是做NLP的，所以diffusion模型会放在最后）等模型，并把这个过程记录一下，一方面是为了自身巩固，另一方面也希望给还没完全掌握算法细节的同学提供参考。希望通过本教程的学习，可以理解AIGC模型的开发原理。本教程完全基于个人学习过程中的理解，难免有不足和错误，欢迎指正和探讨。

本教程分成8个部分（配套代码见https://github.com/firechecking/CleanTransformer）

第一部分：我们会开发NLP中的BPE、WordPiece、ULM分词，实现分词器的train、tokenize、encode、decode；

第二部分：会复现《attention is all you need》中的LayerNorm、MultiHeadAttention，以及TransformerBlock；

第三部分：实现完整的Bert和GPT1/2分词器、模型搭建，并将下载huggingface的Bert、GPT2模型权重加载到我们的框架中完成推理；

第四部分：为了实现生成模型的推理，我们在这一章会实现常用的3种生成策略：Greedy Search、Beam Search、Beam Sample；

第五部分：这部分我们将实现SGD、Adam这2个常用的Optimizer，MSELoss和CrossEntropyLoss这2个常用loss，并在小规模数据集上验证模型训练和模型部署；

前5个部分的配套代码已经开发完成，大家可以clone代码自己测试和修改。后面几个部分的代码还在开发中，会随着教程一起在代码库中更新。

第六部分：加载LLaMA模型权重，基于指令微调数据集和RLHF数据集，实现模型的指令微调，然后部署一个可对外提供服务的大模型实例；

第七部分：为了实现更大规模的模型训练，这部分我们要在框架中实现分布式训练（将要实现data parallel、tensor parallel、pipeline parallel这三种并行方法），同时会尝试activition checkpoint及懒加载等方式，在尽可能少的GPU上实现大模型训练；

第八部分：Diffusion等图像生成模型开发、训练、优化、部署等

推荐体验

相关资讯

TRANSFORMER, BERT, AND GPT：简介

这一章节提供了对生成式人工智能（AI）的快速介绍，重点放在了注意力机制上，这是转换器架构的关键组成部分。您还将了解一些在AI领域具有影响力的公司。本章的第一部分向您介绍了生成式AI，包括其最重要的特

人工智能生成式AI

数据智能老司机 2023-11-25

强化学习—PPO（Proximal Policy Optimization）算法原理及实现

近端策略优化（PPO）算法是OpenAI在2017提出的一种强化学习算法，本文将从PPO算法的基础入手，理解从传统策略梯度算法直到PPO算法的演进过程，以及算法迭代过程中的优化细节。

安可可可可 2023-07-10

长期AI连载小说-《海上猎手》目录及序言

写在前面：本文由chatgpt生成改编而来，有些地方不是很完善。第一次尝试用AI写东西，有时不是很稳定，生成的内容也比较随机，目录和序言大家仅供参考，只是想试一下写到最后是否会和目录南辕北辙，权当一次实验，大家就当看个乐呵。欢迎留言。角色概念图，当然也是AI画的目录序言第一章：踏上征程第二章：孤独的航程第三章：险象环生第四章：战斗的开始第五章：胜利的曙光第六章：激战海域第七章：生死攸关第八章：背水一战第九章：最后的决战结语序言当海洋上的战争燃起时，汉密尔顿·李总是在第一线。他是一名勇

潜水一哥 2023-03-12

chatgpt逐字输出原理及实现

当我们在使用gpt时，会发现他的回复是一段段输出的，很有意思，我们应该怎么样实现这种效果呢?让我们来分析一下

xianjianlf2 2023-06-03

从零实现LLM-GPT2 RLHF（Reinforcement Learning from Human Feedback）

通过前面的预训练和指令微调，我们得到了既能续写文本，又能遵守指令的GPT2模型。但从GPT的演进路线来看，要达到ChatGPT的水平，除了增加模型参数、使用更多的数据预训练、更高质量的监督数据指令微调外，还需要一个重要的技术手段，那就是RLHF。GPT演进路线(RLHF：Reinforcement Learning from Human Feedback)：即基于人类反馈信息，通过强化学习方式优化语言模型，使其产生更符合人类偏好和价值观的回应，从而提高模型的实用性和安全性。前openAI首席科学家、联合创

人工智能大讲堂 2024-06-28

近期资讯

“直男”品牌攻占女性市场，大疆Pocket 3是如何火出圈的？

魔镜洞察显示，2023年11月到2024年10月，在淘宝、天猫普通数码相机类目下，大疆Pocket3以1.24亿元的销售额断层第一，影石Insta360GO3s以0.52亿元的销售额位列第二，索尼ZV-1以0.46亿元的销售额位列第三。

蓝鲸新闻 2024-12-26

独享MRDIMM有多强？至强6性能核处理器的内存二三事

MDB主机侧的运行速度是DRAM侧的双倍，DRAM侧的数据接口是主机侧的双倍。由于至强6900P插座尺寸大增，导致双路机型的内存槽数量从上一代的32条减少到24条。与DDR56,400MT/s相比，MRDIMM8,800MT/s的实际运行频率略低（4,400MT/s），导致轻量级的应用不能从内存带宽的增加当中明显获益。

机器之心Pro 2024-12-26

蘑菇开车满地跑，米饭疯狂长出血肉，这世界还能再抽象点吗？

科学研究的面貌并不总是严肃的，它们有时有趣，有时奇怪，也有时让人大呼离谱。本文将带你回顾2024年那些让人印象深刻的谜之研究。今年，蘑菇也当上了机械驾驶员。在下图中，我们看到的满地爬行的小机器人就是由杏鲍菇控制的——对，就是你平时吃的那种。这个长着五条腿的可动机械装置内部生长着杏鲍菇的菌丝体。

果壳网 2024-12-26

华为Mate 70 Pro+通过三项航天级测试

据华为终端消息，华为Mate70Pro+成功通过模拟火箭360km/h冲击、28米高空跌落和-30度极端低温环境三项航天级测试。华为Mate70Pro+搭载高亮钛玄武架构，可提升手机在抗冲击、抗跌落、抗低温能力。

每日经济新闻 2024-12-26

「e公司观察」技术迭代的溢出效应

无人机变得越来越好用，越来越便宜，受益于汽车产业链，人形机器人变得越来越智能，则受益于大模型。大疆2015年推出第一代的农业植保机MG1时，锂电池保内寿命只有180次。如果以2015年的产品放在现在做吊运不到一个月电池就要报废。另外，大疆无人机还开始搭载激光雷达，激光雷达的发展，也受益于新能源汽车产业链的智能化。

证券时报 2024-12-26

行业发展前景、地方就业机遇哈工大开了家“就业博物馆”

12月25日，哈工大在校园暖廊内搭建“就业博物馆”正式“开门营业”。“就业博物馆”包括“国之重器”模型展区、地方引才宣传展区、中央企业介绍展区。

生活报 2024-12-26

量子通信技术“风起”，相关概念股梳理（附股）

近日，量子通信技术备受关注，被视为未来信息通信领域的重要发展方向。与传统的通信技术相比，量子通信技术的特点及优势体现在具有较高时效性、具有较强的抗干扰性、具有较好的保密性、所需信噪比低等。

证券之星 2024-12-26

微软解析“教育+AI”：小模型带来的智能硬件大爆发，教育亦有结合机会

来源|多知整理|王上摄|张子通近日，在多知OpenTalk第48期“全球起航!‘教育+AI’出海进行时”活动中，微软中国高级解决方案专家王剑白博士发表了主题演讲《GenAl浪潮下教育行业转型及出海的实践与思考》。

多知网 2024-12-26

红果短剧认真整改主动停更5天

红果短剧在接受广电主管部门约见后，高度重视，迅速响应，坚决落实好主管部门关于微短剧管理的有关规定和指导要求，进一步完善审核制度，即日起对平台上所有剧集进行逐一排查，对于发现的违规内容，立即采取下线等措施。

广电视界 2024-12-26

行业首创可变轮足，广汽第三代具身智能人形机器人GoMate正式发布！

12月26日，2024年中国机器人网年会在上海举行。在新品发布环节，广汽集团隆重推出了自主研发的第三代具身智能人形机器人——GoMate。GoMate与张爱民互动GoMate向参会嘉宾点赞张爱民在现场接受媒体采访创新构型领先行业广汽集团此次发布的GoMate是一款全尺寸的轮足人形机器人，全身拥有38个自由度。

爱车兵团 2024-12-26

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1