✦
教学大纲
✦
01
课程的性质、目的与任务
《深度学习》是计算机科学与技术或软件工程专业中的一门深度学习基础课程,该课程以深度学习框架为基础,介绍了机器学习的基础知识与常用方法,以实例的方式学习机器学习操作的原理及其在深度学习框架下的实践步骤。主要内容包括深度学习基础知识、深度学习框架及其对比、机器学习基础知识、Logistic回归、神经网络基础、卷积神经网络与计算机视觉、神经网络与自然语言处理。并通过10个深度学习实例的学习,帮助学生更好的掌握深度学习知识,做到理论与实践相结合,方法与应用相结合。本课程除要求学生掌握以上深度学习知识,更重要的是要求学生掌握理论与实践结合的学习方式,为更深入地学习打下良好的基础。
02
教学内容及教学基本要求
1. 深度学习简介(2学时)
了解计算机视觉的定义、基本任务和传统方法;了解仿生学与深度学习的关联;了解现代深度学习和卷积神经网络的基础知识;了解自然语言处理的基本问题和发展趋势;了解在自然语言处理中传统方法与神经网络方法的比较;了解强化学习的概念、算法和应用。
2. 深度学习框架及其对比(2学时)
了解目前流行的深度学习框架PaddlePaddle、TensorFlow、PyTorch;了解PaddlePaddle的用途、特点和层及网络的概念;了解数据流图;了解TensorFlow的用途、特点和计算形式。了解PyTorch的用途、特点和相对于其他框架的优势;了解PaddlePaddle、TensorFlow、PyTorch三者的比较。
3.机器学习基础知识(4学时)
了解模型评估与模型参数选择;了解误差、训练误差、泛化误差的概念;了解模型的验证和正则化;了解监督学习与非监督学习;了解准确率的概念;了解不平衡类问题、召回率、精确率、查准率的定义和作用。
4. 回归模型(4学时)
了解回归和回归模型;了解线性回归的概念;了解线性回归模型和平均平方误差函数;了解Logistic回归模型;掌握用PyTorch实现Logistic回归的方式,包括使用MultivariateNormal构造多元高斯分布、调用Linear实现线性模型、Sigmoid激活函数、BCELoss损失函数和使用optim包构建优化器等相关知识;掌握将Logistic回归模型可视化的方法。
5. 神经网络基础(4学时)
了解神经元、输入、连接权值向量、偏置、激活函数、输出、神经网络、输入层、输出层、隐藏层、训练、监督训练、非监督训练的概念;了解感知器的概念,包括单层感知器和多层感知器;了解BP(后向传播)神经网络、梯度下降算法和后向传播算法;了解Dropout正则化技术;了解批标准化的实现方式和使用方法。
6. 卷积神经网络和计算机视觉(8学时)
了解卷积神经网络的基本思想,包括全局连接、局部连接、参数共享;了解卷积操作,包括卷积、卷积层和卷积核的基本概念;了解卷积中使用多个卷积核、多通道卷积和边界填充等操作;了解池化和常见的池化类型;了解卷积神经网络;了解VGG、InceptionNet、ResNet等经典网络结构;了解使用PyTorch进行手写数字识别的过程。
7.神经网络与自然语言处理(8学时)
了解语言建模的基本形式;了解自然语言处理基于多层感知器的架构;了解自然语言处理基于循环神经网络的架构,包括循环单元、通过时间后向传播、带有门限的循环单元、循环神经网络语言模型和神经机器翻译的相关知识;了解自然语言处理基于卷积神经网络的架构;了解自然语言处理基于Transformer的架构,包括多头注意力、非参位置编码、编码器单元与解码器单元的相关知识;了解表示学习与预训练技术。
9. 实验(16学时)
教学说明及教学基本要求见《深度学习》实验教学大纲。
03
教学方法
本课程教学方法以教师为主导的启发式讲授教学法为主,讨论(提问)式教学为辅,结合课外学习的教学方法。实验以学生动手实验为主,教师的启发式讲授教学法为辅,并结合讨论(提问)式教学,以及结合课外学习的教学方法。
1.本课程概念较多,因此教学形式以讲授方式为主。本课程拟采用多媒体PPT的教学方法,增加课堂信息,浅显通俗地对概念、定义和原理进行解释,增加教学的直观性,教学过程中注意各个知识点的关联性,以使学生更好地理解课程内容。
2.对课程中关键性概念、设计思想方面的问题可辅以课堂讨论的形式。
3.为加强和落实动手能力的培养,每章课后应安排作业,帮助学生学习和应用。
04
课内外教学环节及基本要求
本课程共48个学时,其中理论32个学时,讲授16周(每周2学时);实验16个学时,讲授8周(每周2学时)。
课外学习要求:
1.做好课前预习,预习时以教材为主,了解相关的概念、定义、原理。预习中认真思考,以便带着问题主动地听课。
2.课后要复习,有余力的学生复习时还应阅读参考资料,认真整理课堂听课笔记。
3.要求学生课外自主学习,学生课外阅读的参考资料以本大纲所列参考资料为主。
05
考核内容及方式
本课程成绩由平时成绩和期末考核成绩组合而成,课程成绩以百分制计算,分配比例如下:
1.平时成绩占30%,主要考查作业的完成程度,理论课和实验课的出勤率,实验课的考试结果。其中作业占10%,实验占15%,出勤率占5%。
2.期末成绩占70%,采用考试的考核方式。考试采用闭卷形式,题型为选择题、正确/错误题、填空题、简答题,以及应用题。
06
持续改进
本课程根据学生作业、课堂讨论、平时考核情况和学生、教学督导等反馈,及时对教学中不足之处进行改进,并在下一轮课程教学中改进。
07
建议教材及参考资料
建议教材:
[1]深度学习. 吕云翔,王志鹏,等[M]北京:清华大学出版社,2024
✦
实验教学大纲
✦
1. Pytorch基础及安装(2学时)
2. TensorFlow基础及安装(2学时)
3. PaddlePaddle基础及安装(2学时)
4. 一个简单的图像分类模型(2学时)
5. 两阶段目标检测和语义分割(2学时)
6. 人脸实时定位与关键点检测(2学时)
7. 调用远程服务实现人脸美颜与颜值评分(2学时)
8. 以假乱真的图像生成(2学时)
✦
参考书籍
✦
深度学习(微课视频版)
编辑推荐:项目案例丰富,注重实践,配源代码、微课视频、教学课件、教学大纲、习题答案
作者:吕云翔 王志鹏 主编 王渌汀 刘卓然 韩雪婷 梁菁菁 副主编丛书名:大数据与人工智能技术丛书定价:59.90元ISBN:9787302670728出版日期:2024.08.01
随着技术的发展,深度学习已经成为各个领域的热门话题。深度学习是人工智能领域中的重要分支,其地位越来越受到重视。深度学习具有优秀的自动特征提取能力和高精度的预测和分类能力,已经在图像识别、语音识别、自然语言处理、机器翻译等领域取得了很好的成果。而随着技术的不断发展和应用场景的不断拓展,深度学习在各个领域内的影响力越来越大,已经成为现代科技发展的重要推动力量,而且未来的影响力和作用也会越来越广泛,将成为人类社会进步的重要驱动力之一。
本书主要内容
本书是一本以深度学习为主题的书,目的是让读者尽可能深入地理解深度学习的技术。此外,本书强调将理论与实践结合,简明的案例不仅能加深读者对于理论知识的理解,还能让读者直观感受到实际生产中深度学习技术应用的过程。
全书共分为三大部分,共17章。
第一部分深度学习理论基础,包括第1~7章。
第1章深度学习简介,包括计算机视觉、自然语言处理、强化学习;第2章深度学习框架及其对比,包括PyTorch、TensorFlow、PaddlePaddle,以及三者的比较;第3章机器学习基础知识,包括机器学习概述、监督学习、无监督学习、强化学习、神经网络和深度学习,以及一个案例;第4章回归模型,包括线性回归、Logistic回归、用PyTorch实现Logistic回归;第5章神经网络基础,包括基础概念、感知器、BP神经网络、Dropout正则化、批标准化;第6章卷积神经网络与计算机视觉,包括卷积神经网络的基本思想、卷积操作、池化层、卷积神经网络、经典网络结构、用PyTorch进行手写数字识别;第7章神经网络与自然语言处理,包括语言建模、基于多层感知机的架构、基于循环神经网络的架构、基于卷积神经网络的架构、基于Transformer的架构、表示学习与预训练技术。
第二部分深度学习实验,包括第8、9章。
第8章操作实践,包括PyTorch操作实践、TensorFlow操作实践、PaddlePaddle操作实践;第9章综合项目实验,包括计算机视觉、自然语言处理、强化学习、可视化技术。
第三部分深度学习案例,包括第10~17章。
第10章基于ResNet的跨域数据集图像分类;第11章基于YOLO V3的安全帽佩戴检测;第12章基于PaddleOCR的车牌识别,第13章基于PaddleSeg的动物图片语义分割;第14章基于SRCNN图像超分辨率;第15章基于TensorFlowTTS的中文语音合成;第16章基于LSTM的原创音乐生成;第17章基于FastR-NN的视频问答。
目录
第一部分理论基础
第1章深度学习简介
1.1计算机视觉
1.1.1定义
1.1.2基本任务
1.1.3传统方法
1.1.4仿生学与深度学习
1.1.5现代深度学习
1.1.6小结
1.2自然语言处理
1.2.1自然语言处理的基本问题
1.2.2传统方法与神经网络方法的比较
1.2.3发展趋势
1.3强化学习
1.3.1什么是强化学习
1.3.2强化学习算法简介
1.3.3强化学习的应用
小结
习题
第2章深度学习框架及其对比
2.1PyTorch
2.1.1PyTorch简介
2.1.2PyTorch的特点
2.1.3PyTorch概述
2.2TensorFlow
2.2.1TensorFlow简介
2.2.2数据流图
2.2.3TensorFlow的特点
2.2.4TensorFlow概述
2.3PaddlePaddle
2.3.1PaddlePaddle简介
2.3.2PaddlePaddle的特点
2.3.3PaddlePaddle的应用
2.4三者的比较
小结
习题
第3章机器学习基础知识
3.1机器学习概述
3.1.1关键术语
3.1.2机器学习的分类
3.1.3机器学习的模型构造过程
3.2监督学习
3.2.1线性回归
3.2.2Logistic回归
3.2.3最小近邻法
3.2.4线性判别分析法
3.2.5朴素贝叶斯分类算法
3.2.6决策树分类算法
3.2.7支持向量机分类算法
3.3非监督学习
3.3.1划分式聚类方法
3.3.2层次化聚类方法
3.3.3基于密度的聚类方法
3.4强化学习
3.4.1强化学习、监督学习和非监督学习
3.4.2强化学习问题描述
3.4.3强化学习问题分类
3.5神经网络和深度学习
3.5.1感知器模型
3.5.2前馈神经网络
3.5.3卷积神经网络
3.5.4其他类型结构的神经网络
3.6案例:银行贷款用户筛选
小结
习题
第4章回归模型
4.1线性回归
4.2Logistic回归
4.3用PyTorch实现Logistic回归
4.3.1数据准备
4.3.2线性方程
4.3.3激活函数
4.3.4损失函数
4.3.5优化算法
4.3.6模型可视化
小结
习题
第5章神经网络基础
5.1基础概念
5.2感知器
5.2.1单层感知器
5.2.2多层感知器
5.3BP神经网络
5.3.1梯度下降
5.3.2后向传播
5.4Dropout正则化
5.5批标准化
5.5.1Batch Normalization的实现方式
5.5.2Batch Normalization的使用方法
小结
习题
第6章卷积神经网络与计算机视觉
6.1卷积神经网络的基本思想
6.2卷积操作
6.3池化层
6.4卷积神经网络
6.5经典网络结构
6.5.1VGG网络
6.5.2InceptionNet
6.5.3ResNet
6.6用PyTorch进行手写数字识别
小结
习题
第7章神经网络与自然语言处理
7.1语言建模
7.2基于多层感知器的架构
7.3基于循环神经网络的架构
7.3.1循环单元
7.3.2通过时间后向传播
7.3.3带有门限的循环单元
7.3.4循环神经网络语言模型
7.3.5神经机器翻译
7.4基于卷积神经网络的架构
7.5基于Transformer的架构
7.5.1多头注意力
7.5.2非参位置编码
7.5.3编码器单元与解码器单元
7.6表示学习与预训练技术
7.6.1词向量
7.6.2加入上下文信息的特征表示
7.6.3网络预训练
小结
习题
第二部分实验
第8章操作实践
8.1PyTorch操作实践
8.1.1PyTorch安装
8.1.2Tensor对象及其运算
8.1.3Tensor的索引和切片
8.1.4Tensor的变换、拼接和拆分
8.1.5PyTorch的Reduction操作
8.1.6PyTorch的自动微分
8.2TensorFlow操作实践
8.2.1TensorFlow安装
8.2.2Tensor对象及其运算
8.2.3Tensor的索引和切片
8.2.4Tensor的变换、拼接和拆分
8.2.5TensorFlow的Reduction操作
8.2.6TensorFlow的自动微分
8.3PaddlePaddle操作实践
8.3.1PaddlePaddle安装
8.3.2Tensor的创建和初始化
8.3.3Tensor的常见基础操作
8.3.4自动微分
小结
第9章综合项目实验
9.1计算机视觉
9.1.1一个通用的图像分类模型
9.1.2两阶段目标检测和语义分割
9.1.3人物图像处理
9.1.4调用远程服务
9.1.5动漫图像生成
9.2自然语言处理
9.2.1垃圾邮件分类
9.2.2词嵌入技术
9.2.3文本生成与多轮对话
9.2.4语音识别
9.3强化学习
9.4可视化技术
9.4.1使用TensorBoard可视化训练过程
9.4.2卷积核可视化
9.4.3注意力机制可视化
第三部分案例
第10章案例:基于ResNet的跨域数据集图像分类
10.1迁移学习
10.2数据集介绍与预处理
10.2.1数据集介绍
10.2.2数据预处理
10.3数据加载与模型训练
10.3.1数据集加载
10.3.2模型训练
10.4运行结果
小结
第11章案例:基于YOLO V3的安全帽佩戴检测
11.1数据准备
11.1.1数据采集与标注
11.1.2模型和框架选择
11.1.3数据格式转换
11.2模型构建、训练和测试
11.2.1YOLO系列模型
11.2.2模型训练
11.2.3测试与结果
小结
第12章案例:基于PaddleOCR的车牌识别
12.1车牌识别简介
12.1.1车牌识别应用及发展史
12.1.2基于深度学习的车牌识别技术
12.2基于PaddleOCR的车牌识别实现
12.2.1PaddleOCR简介与环境准备
12.2.2CCPD数据集介绍
12.2.3数据集准备与预处理
12.2.4模型选择与训练
小结
第13章案例:基于PaddleSeg的动物图片语义分割
13.1语义分割应用简介
13.2基于PaddleSeg的语义分割实现
13.2.1PaddleSeg简介与环境准备
13.2.2OxfordIIIT Pet数据集介绍
13.2.3模型训练
13.2.4模型的评估与测试
小结
第14章案例:基于SRCNN图像超分辨率
14.1SRCNN介绍
14.2技术方案及核心代码
14.2.1模型训练要点
14.2.2构造函数
14.2.3构建SRCNN的结构
14.2.4模型训练
小结
第15章案例:基于TensorFlowTTS的中文语音合成
15.1TTS简介
15.1.1语音合成技术
15.1.2TTS技术发展史和基本原理
15.1.3基于深度学习的TTS
15.2基于TensorFlowTTS的语音合成实现
15.2.1TensorFlowTTS简介与环境准备
15.2.2算法简介
15.2.3代码实现与结果展示
第16章案例:基于LSTM的原创音乐生成
16.1样例背景介绍
16.1.1循环神经网络
16.1.2Music 21
16.1.3TensorFlow
16.2项目结构设计
16.3实验步骤
16.3.1搭建实验环境
16.3.2观察并分析数据
16.3.3数据预处理
16.3.4生成音乐
16.4成果检验
第17章案例:基于Fast RCNN的视频问答
17.1视频问答与联合嵌入模型
17.2准备工作
17.2.1下载数据
17.2.2软件包和配置文件
17.3基础模块实现
17.3.1FCNet
17.3.2SimpleClassifier模块
17.4问题嵌入模块实现
17.4.1词嵌入
17.4.2RNN
17.5TopDown Attention模块实现
17.6VQA系统实现
17.7模型训练与可视化
17.7.1模型训练
17.7.2可视化
小结
附录A深度学习的数学基础
A.1线性代数
A.2概率论
参考文献
本书特色
(1)注重理论,联系实际。
本书为重要的知识点部分配备了典型例题,通过大量的实例,展示了深度学习在图像处理、自然语言处理等领域的应用,使读者能够深入了解实际应用场景。
(2)由浅入深,通俗易懂。
本书用简明易懂的语言描述深度学习的概念和原理,同时配以丰富的图表和实例,读者更易于理解和掌握。
(3)内容丰富,系统全面。
本书内容按照从基础到高级的顺序进行排列,涵盖了深度学习的基础知识、常用模型以及实践中的技巧和工具,从理论到实践全面覆盖,读者可以逐步深入地了解深度学习的各个方面。
(4)结合实际,方便实用。
本书介绍了多种常用的深度学习框架和工具的使用方法,包括TensorFlow、PyTorch、PaddlePaddle等,能够让读者快速上手实践。
配套资源
为便于教与学,本书配有微课视频、源代码、教学课件、教学大纲、习题答案。
读者对象
本书适合Python深度学习初学者、机器学习算法分析从业人员以及高等学校计算机科学、软件工程等相关专业的师生阅读。
在公众号书圈后台回复【9787302670728】,下载本书配套的教学资源
单击页面下方【阅读原文】,订阅【教学大纲】栏目