深度学习(微课视频版)
编辑推荐:项目案例丰富,注重实践,配源代码、微课视频、教学课件、教学大纲、习题答案
作者:吕云翔 王志鹏 主编 王渌汀 刘卓然 韩雪婷 梁菁菁 副主编丛书名:大数据与人工智能技术丛书定价:59.90元ISBN:9787302670728出版日期:2024.08.01
随着技术的发展,深度学习已经成为各个领域的热门话题。深度学习是人工智能领域中的重要分支,其地位越来越受到重视。深度学习具有优秀的自动特征提取能力和高精度的预测和分类能力,已经在图像识别、语音识别、自然语言处理、机器翻译等领域取得了很好的成果。而随着技术的不断发展和应用场景的不断拓展,深度学习在各个领域内的影响力越来越大,已经成为现代科技发展的重要推动力量,而且未来的影响力和作用也会越来越广泛,将成为人类社会进步的重要驱动力之一。
本书主要内容
本书是一本以深度学习为主题的书,目的是让读者尽可能深入地理解深度学习的技术。此外,本书强调将理论与实践结合,简明的案例不仅能加深读者对于理论知识的理解,还能让读者直观感受到实际生产中深度学习技术应用的过程。
全书共分为三大部分,共17章。
第一部分深度学习理论基础,包括第1~7章。
第1章深度学习简介,包括计算机视觉、自然语言处理、强化学习;第2章深度学习框架及其对比,包括PyTorch、TensorFlow、PaddlePaddle,以及三者的比较;第3章机器学习基础知识,包括机器学习概述、监督学习、无监督学习、强化学习、神经网络和深度学习,以及一个案例;第4章回归模型,包括线性回归、Logistic回归、用PyTorch实现Logistic回归;第5章神经网络基础,包括基础概念、感知器、BP神经网络、Dropout正则化、批标准化;第6章卷积神经网络与计算机视觉,包括卷积神经网络的基本思想、卷积操作、池化层、卷积神经网络、经典网络结构、用PyTorch进行手写数字识别;第7章神经网络与自然语言处理,包括语言建模、基于多层感知机的架构、基于循环神经网络的架构、基于卷积神经网络的架构、基于Transformer的架构、表示学习与预训练技术。
第二部分深度学习实验,包括第8、9章。
第8章操作实践,包括PyTorch操作实践、TensorFlow操作实践、PaddlePaddle操作实践;第9章综合项目实验,包括计算机视觉、自然语言处理、强化学习、可视化技术。
第三部分深度学习案例,包括第10~17章。
第10章基于ResNet的跨域数据集图像分类;第11章基于YOLO V3的安全帽佩戴检测;第12章基于PaddleOCR的车牌识别,第13章基于PaddleSeg的动物图片语义分割;第14章基于SRCNN图像超分辨率;第15章基于TensorFlowTTS的中文语音合成;第16章基于LSTM的原创音乐生成;第17章基于FastR-NN的视频问答。
目录
第一部分理论基础
第1章深度学习简介
1.1计算机视觉
1.1.1定义
1.1.2基本任务
1.1.3传统方法
1.1.4仿生学与深度学习
1.1.5现代深度学习
1.1.6小结
1.2自然语言处理
1.2.1自然语言处理的基本问题
1.2.2传统方法与神经网络方法的比较
1.2.3发展趋势
1.3强化学习
1.3.1什么是强化学习
1.3.2强化学习算法简介
1.3.3强化学习的应用
小结
习题
第2章深度学习框架及其对比
2.1PyTorch
2.1.1PyTorch简介
2.1.2PyTorch的特点
2.1.3PyTorch概述
2.2TensorFlow
2.2.1TensorFlow简介
2.2.2数据流图
2.2.3TensorFlow的特点
2.2.4TensorFlow概述
2.3PaddlePaddle
2.3.1PaddlePaddle简介
2.3.2PaddlePaddle的特点
2.3.3PaddlePaddle的应用
2.4三者的比较
小结
习题
第3章机器学习基础知识
3.1机器学习概述
3.1.1关键术语
3.1.2机器学习的分类
3.1.3机器学习的模型构造过程
3.2监督学习
3.2.1线性回归
3.2.2Logistic回归
3.2.3最小近邻法
3.2.4线性判别分析法
3.2.5朴素贝叶斯分类算法
3.2.6决策树分类算法
3.2.7支持向量机分类算法
3.3非监督学习
3.3.1划分式聚类方法
3.3.2层次化聚类方法
3.3.3基于密度的聚类方法
3.4强化学习
3.4.1强化学习、监督学习和非监督学习
3.4.2强化学习问题描述
3.4.3强化学习问题分类
3.5神经网络和深度学习
3.5.1感知器模型
3.5.2前馈神经网络
3.5.3卷积神经网络
3.5.4其他类型结构的神经网络
3.6案例:银行贷款用户筛选
小结
习题
第4章回归模型
4.1线性回归
4.2Logistic回归
4.3用PyTorch实现Logistic回归
4.3.1数据准备
4.3.2线性方程
4.3.3激活函数
4.3.4损失函数
4.3.5优化算法
4.3.6模型可视化
小结
习题
第5章神经网络基础
5.1基础概念
5.2感知器
5.2.1单层感知器
5.2.2多层感知器
5.3BP神经网络
5.3.1梯度下降
5.3.2后向传播
5.4Dropout正则化
5.5批标准化
5.5.1Batch Normalization的实现方式
5.5.2Batch Normalization的使用方法
小结
习题
第6章卷积神经网络与计算机视觉
6.1卷积神经网络的基本思想
6.2卷积操作
6.3池化层
6.4卷积神经网络
6.5经典网络结构
6.5.1VGG网络
6.5.2InceptionNet
6.5.3ResNet
6.6用PyTorch进行手写数字识别
小结
习题
第7章神经网络与自然语言处理
7.1语言建模
7.2基于多层感知器的架构
7.3基于循环神经网络的架构
7.3.1循环单元
7.3.2通过时间后向传播
7.3.3带有门限的循环单元
7.3.4循环神经网络语言模型
7.3.5神经机器翻译
7.4基于卷积神经网络的架构
7.5基于Transformer的架构
7.5.1多头注意力
7.5.2非参位置编码
7.5.3编码器单元与解码器单元
7.6表示学习与预训练技术
7.6.1词向量
7.6.2加入上下文信息的特征表示
7.6.3网络预训练
小结
习题
第二部分实验
第8章操作实践
8.1PyTorch操作实践
8.1.1PyTorch安装
8.1.2Tensor对象及其运算
8.1.3Tensor的索引和切片
8.1.4Tensor的变换、拼接和拆分
8.1.5PyTorch的Reduction操作
8.1.6PyTorch的自动微分
8.2TensorFlow操作实践
8.2.1TensorFlow安装
8.2.2Tensor对象及其运算
8.2.3Tensor的索引和切片
8.2.4Tensor的变换、拼接和拆分
8.2.5TensorFlow的Reduction操作
8.2.6TensorFlow的自动微分
8.3PaddlePaddle操作实践
8.3.1PaddlePaddle安装
8.3.2Tensor的创建和初始化
8.3.3Tensor的常见基础操作
8.3.4自动微分
小结
第9章综合项目实验
9.1计算机视觉
9.1.1一个通用的图像分类模型
9.1.2两阶段目标检测和语义分割
9.1.3人物图像处理
9.1.4调用远程服务
9.1.5动漫图像生成
9.2自然语言处理
9.2.1垃圾邮件分类
9.2.2词嵌入技术
9.2.3文本生成与多轮对话
9.2.4语音识别
9.3强化学习
9.4可视化技术
9.4.1使用TensorBoard可视化训练过程
9.4.2卷积核可视化
9.4.3注意力机制可视化
第三部分案例
第10章案例:基于ResNet的跨域数据集图像分类
10.1迁移学习
10.2数据集介绍与预处理
10.2.1数据集介绍
10.2.2数据预处理
10.3数据加载与模型训练
10.3.1数据集加载
10.3.2模型训练
10.4运行结果
小结
第11章案例:基于YOLO V3的安全帽佩戴检测
11.1数据准备
11.1.1数据采集与标注
11.1.2模型和框架选择
11.1.3数据格式转换
11.2模型构建、训练和测试
11.2.1YOLO系列模型
11.2.2模型训练
11.2.3测试与结果
小结
第12章案例:基于PaddleOCR的车牌识别
12.1车牌识别简介
12.1.1车牌识别应用及发展史
12.1.2基于深度学习的车牌识别技术
12.2基于PaddleOCR的车牌识别实现
12.2.1PaddleOCR简介与环境准备
12.2.2CCPD数据集介绍
12.2.3数据集准备与预处理
12.2.4模型选择与训练
小结
第13章案例:基于PaddleSeg的动物图片语义分割
13.1语义分割应用简介
13.2基于PaddleSeg的语义分割实现
13.2.1PaddleSeg简介与环境准备
13.2.2OxfordIIIT Pet数据集介绍
13.2.3模型训练
13.2.4模型的评估与测试
小结
第14章案例:基于SRCNN图像超分辨率
14.1SRCNN介绍
14.2技术方案及核心代码
14.2.1模型训练要点
14.2.2构造函数
14.2.3构建SRCNN的结构
14.2.4模型训练
小结
第15章案例:基于TensorFlowTTS的中文语音合成
15.1TTS简介
15.1.1语音合成技术
15.1.2TTS技术发展史和基本原理
15.1.3基于深度学习的TTS
15.2基于TensorFlowTTS的语音合成实现
15.2.1TensorFlowTTS简介与环境准备
15.2.2算法简介
15.2.3代码实现与结果展示
第16章案例:基于LSTM的原创音乐生成
16.1样例背景介绍
16.1.1循环神经网络
16.1.2Music 21
16.1.3TensorFlow
16.2项目结构设计
16.3实验步骤
16.3.1搭建实验环境
16.3.2观察并分析数据
16.3.3数据预处理
16.3.4生成音乐
16.4成果检验
第17章案例:基于Fast RCNN的视频问答
17.1视频问答与联合嵌入模型
17.2准备工作
17.2.1下载数据
17.2.2软件包和配置文件
17.3基础模块实现
17.3.1FCNet
17.3.2SimpleClassifier模块
17.4问题嵌入模块实现
17.4.1词嵌入
17.4.2RNN
17.5TopDown Attention模块实现
17.6VQA系统实现
17.7模型训练与可视化
17.7.1模型训练
17.7.2可视化
小结
附录A深度学习的数学基础
A.1线性代数
A.2概率论
参考文献
本书特色
(1)注重理论,联系实际。
本书为重要的知识点部分配备了典型例题,通过大量的实例,展示了深度学习在图像处理、自然语言处理等领域的应用,使读者能够深入了解实际应用场景。
(2)由浅入深,通俗易懂。
本书用简明易懂的语言描述深度学习的概念和原理,同时配以丰富的图表和实例,读者更易于理解和掌握。
(3)内容丰富,系统全面。
本书内容按照从基础到高级的顺序进行排列,涵盖了深度学习的基础知识、常用模型以及实践中的技巧和工具,从理论到实践全面覆盖,读者可以逐步深入地了解深度学习的各个方面。
(4)结合实际,方便实用。
本书介绍了多种常用的深度学习框架和工具的使用方法,包括TensorFlow、PyTorch、PaddlePaddle等,能够让读者快速上手实践。
配套资源
为便于教与学,本书配有微课视频、源代码、教学课件、教学大纲、习题答案。
读者对象
本书适合Python深度学习初学者、机器学习算法分析从业人员以及高等学校计算机科学、软件工程等相关专业的师生阅读。