当前位置:首页|资讯|AI大模型|人工智能|百度

实战AI大模型

作者:青花瓷底的大熊猫发布时间:2024-03-09

链接:https://pan.baidu.com/s/1VjPdCyKQbHfXMTKILhgWSQ?pwd=z1m0 

ISBN编号:9787111738787书名:实战AI大模型作者:尤洋定:99.00元开本:184mm*240mm开出版社名称:机械工业出版社出版时间:2023-11《实战AI大模型》是一本在填补人工智能(AI)领域(别是AI大模型)理论与实践之间鸿沟的实用手册。书中介绍了AI大模型的基础知识和关键技术,如Transformer、BERT、ALBERT、T5、GPT系列、InstructGPT、ChatGPT、GPT 4、PaLM和视觉模型等,并详细解释了这些模型的技术原理、实际应用以及高性能计算(HPC)技术的使用,如并行计算和内存化。同时,《实战AI大模型》还提供了实践案例,详细介绍了如何使用Colossal AI训练各种模型。无论是人工智能初还是经验丰富的实践者,能从本书学到实用的知识和技能,从而在迅速发展的AI领域中找到适合自己的方向。第1章 深度学中的AI大模型1.1 AI大模型在人工智能领域的兴起1.1.1 AI大模型的发展与挑战1.1.2 AI大模型为何难以训练1.2 深度学框架入门1.2.1 搭建经网络1.2.2 训练一个文本分类器第2章 分布式系统:AI大模型的诞生之所2.1 深度学与分布式系统2.1.1 从分布式计算到分布式AI系统2.1.2 大规模分布式训练平台的关键技术2.1.3 Colossal AI应用实践2.2 AI大模型训练方法2.2.1 梯度累积和梯度裁剪2.2.2 大批量化器LARSLAMB2.2.3 模型度与混合度训练2.3 异构训练2.3.1 异构训练的基本原理2.3.2 异构训练的实现策略2.4 实战分布式训练2.4.1 Colossal AI环境搭建2.4.2 使用Colossal AI训练第一个模型2.4.3 AI大模型的异构训练第3章 分布式训练:上千台机器如何共同起舞3.1 并行策略基础原理3.1.1 数据并行:基本的并行训练范式3.1.2 张量并行:层内模型并行3.1.3 流水线并行的原理与实现3.2 高级并行策略基础原理3.2.1 序列并行:长序列模型训练3.2.2 混合并行:扩展模型到参数3.2.3 自动并行:自动化的分布式并行训练3.3 实战分布式训练3.3.1 应用模型并行策略的实际案例3.3.2 结合多种并行策略的训练实践第4章 AI大模型时代的奠基石Transformer模型4.1 自然语言处理基础4.1.1 自然语言任务介绍4.1.2 语言输入的预处理4.1.3 序列到序列模型4.2 Transformer详解4.2.1 Transformer模型结构4.2.2 注意力与自注意力机制4.2.3 Transformer中的归一化4.3 Tr


Copyright © 2026 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1