TRANSFORMER, BERT, AND GPT：简介

作者：数据智能老司机发布时间：2023-11-25

人工智能生成式AI

这一章节提供了对生成式人工智能（AI）的快速介绍，重点放在了注意力机制上，这是转换器架构的关键组成部分。您还将了解一些在AI领域具有影响力的公司。本章的第一部分向您介绍了生成式AI，包括其最重要的特...【查看原文】

相关资讯

比Transformer更好，无Attention、MLPs的BERT、GPT反而更强了

从 BERT、GPT 和 Flan-T5 等语言模型到 SAM 和 Stable Diffusion 等图像模型，Transformer 正以锐不可当之势席卷这个世界，但人们也不禁会问：Transfo

Stable Diffusion

机器之心 2023-10-30

BERT基础教程 Transformer大模型实战

链接：https://pan.baidu.com/s/11iG6hxx_nDADWbqLw4hm8g?pwd=29v6 提取码：29v6苏达哈尔桑.拉维昌迪兰（Sudharsan Ravichandiran）热爱开源社区的数据科学家，研究方向为深度学习和强化学习的实际应用，在自然语言处理和计算机视觉等领域都颇有建树，另著有《Python强化学习实战》。【译者简介】周参就职于谷歌，任软件工程师，研究方向为自然语言处理。工作之余的兴趣是研究人工智能领域机器学习方向以及新的模型算法，并将多种深度学习模型应用于实

百度谷歌人工智能深度学习

刘小六六不六 2023-04-14

从零实现BERT、GPT及Difussion类算法：文章简介及目录

本教程特点：除了python基础库和pytorch基础运算外，不借助其他第三方库从零推导、实现Transformer及Bert、GPT、Diffusion等热门模型从零实现data parallel、tensor parallel、pipeline parallel等并行训练策略借助开源大模型权重，从零实现SFT+RLHF的训练、部署平时工作忙，如果有同学有精力和意愿来一起完善代码和教程，欢迎私信联系随着Transformer在文本、图像等领域的应用，以及ChatGPT的爆火，可以说只要掌握了基础算法知识

源大模型编程 ChatGPT

一代闲人 2023-04-22

BERT 模型详解

科学突破很少发生在真空中。相反，它们往往是建立在积累的人类知识之上的阶梯的倒数第二步。要了解 ChatGPT 和 Google Bart 等大型语言模型（LLM）的成功，我们需要回到过去并谈论

大语言模型 ChatGPT 谷歌

杨大 2024-01-23

大规模 Transformer 模型 8 比特矩阵乘简介 - 基于 Hugging Face Transformers、Accelerate 以及 bitsan

引言语言模型一直在变大。截至撰写本文时，PaLM 有 5400 亿参数，OPT、GPT-3 和 BLOOM 有大约 1760 亿参数，而且我们仍在继续朝着更大的模型发展。下图总结了最近的一些语言模型

Hugging Face

HuggingFace 2023-04-25

近期资讯

如何有效关闭摄像头保护隐私及提高工作专注力的方法总结

在现代生活中，摄像头几乎无处不在。无论是在手机、电脑，还是各种智能设备上，摄像头的使用越来越普遍。虽然这给我们的生活带来了很多方便，比如视频聊天、在线会议和拍照等，但有时候我们也希望关闭摄像头，保护个人隐私或避免不必要的干扰。那么，怎么才能关闭这些摄像头呢？接下来，我就来聊聊这个话题。首先，关闭摄像头的方法其实很简单。

新报观察 2024-12-31

迈瑞医疗获得外观设计专利授权：“探头”

证券之星消息，根据天眼查APP数据显示迈瑞医疗（300760）新获得一项外观设计专利授权，专利名为“探头”，专利申请号为CN202430251573.6，授权日为2024年12月31日。2.本外观设计产品的用途：本外观设计产品用于医疗卫生事业，主要用于体内器官的检测。

证券之星 2024-12-31

了解电脑配置的基本知识与如何评估，提升使用体验与性能优化技巧

在如今这个信息化的时代，电脑几乎成了每个人生活中不可或缺的一部分。不过，很多人对电脑的配置一头雾水，不知道该怎么看、怎么看懂。电脑的核心部件主要包括中央处理器（CPU）、内存（RAM）、存储（硬盘）、显卡、主板等。内存越大，能同时运行的程序就越多，电脑也就越流畅。

新报观察 2024-12-31

如何在生活中放大图像、思维、情感和梦想，提升自我体验

无论是放大一张照片，还是放大一个想法，放大的过程都能让我们更清晰地看到细节，理解事物的本质。在Photoshop中，你可以使用“裁剪”工具，选择你想要放大的部分，然后再调整图像的分辨率。

新报观察 2024-12-31

多种方法轻松打开和处理 VSD 文件的实用指南

在日常生活中，我们常常会遇到各种各样的文件格式。不过，Visio并不是免费的软件，所以如果你没有安装，或者不想花钱买这个软件，接下来我给你推荐一些替代方案。

新报观察 2024-12-31

精研科技获得发明专利授权：“折叠屏电子设备用折叠转轴”

证券之星消息，根据天眼查APP数据显示精研科技（300709）新获得一项发明专利授权，专利名为“折叠屏电子设备用折叠转轴”，专利申请号为CN202010356631.2，授权日为2024年12月31日。

证券之星 2024-12-31

长江电力获得实用新型专利授权：“用于闸室侧墙清洗装置的曲臂举升机构”

证券之星消息，根据天眼查APP数据显示长江电力（600900）新获得一项实用新型专利授权，专利名为“用于闸室侧墙清洗装置的曲臂举升机构”，专利申请号为CN202420982733.9，授权日为2024年12月31日。

证券之星 2024-12-31

八一钢铁获得实用新型专利授权：“一种应用于摆剪的新型锁紧缸”

证券之星消息，根据天眼查APP数据显示八一钢铁（600581）新获得一项实用新型专利授权，专利名为“一种应用于摆剪的新型锁紧缸”，专利申请号为CN202421133636.9，授权日为2024年12月31日。

证券之星 2024-12-31

开立医疗获得实用新型专利授权：“一种导管固定装置”

证券之星消息，根据天眼查APP数据显示开立医疗（300633）新获得一项实用新型专利授权，专利名为“一种导管固定装置”，专利申请号为CN202323669177.4，授权日为2024年12月31日。

证券之星 2024-12-31

在Word中绘制虚线的多种方法与技巧解析

在日常办公中，Word是我们常用的一个工具，它的功能强大，能够满足很多不同的需求。今天，我们就来聊聊如何在Word中画虚线。虚线的用途很多，比如在制作一些表格、设计海报或者写一些文档时，虚线能够帮助我们更好地分隔内容，增加视觉效果。接下来，我们就一步一步来看看怎么操作。首先，打开你的Word文档，如果你还没有创建文档，可以新建一个。

新报观察 2024-12-31

TRANSFORMER, BERT, AND GPT：简介

推荐体验

相关资讯

比Transformer更好，无Attention、MLPs的BERT、GPT反而更强了

BERT基础教程 Transformer大模型实战

从零实现BERT、GPT及Difussion类算法：文章简介及目录

BERT 模型详解

大规模 Transformer 模型 8 比特矩阵乘简介 - 基于 Hugging Face Transformers、Accelerate 以及 bitsan

近期资讯

如何有效关闭摄像头保护隐私及提高工作专注力的方法总结

迈瑞医疗获得外观设计专利授权：“探头”

了解电脑配置的基本知识与如何评估，提升使用体验与性能优化技巧

如何在生活中放大图像、思维、情感和梦想，提升自我体验

多种方法轻松打开和处理 VSD 文件的实用指南

精研科技获得发明专利授权：“折叠屏电子设备用折叠转轴”

长江电力获得实用新型专利授权：“用于闸室侧墙清洗装置的曲臂举升机构”

八一钢铁获得实用新型专利授权：“一种应用于摆剪的新型锁紧缸”

开立医疗获得实用新型专利授权：“一种导管固定装置”

在Word中绘制虚线的多种方法与技巧解析

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响