当前位置:首页|资讯|机器学习|深度学习|百度

新书推荐 | 机器学习导论与实践

作者:书圈发布时间:2024-03-19

原标题:新书推荐 | 机器学习导论与实践

机器学习是人工智能研究领域中一个重要的方向,是一门研究机器怎样模拟或实现人类学习行为以获取新知识或技能,并重新组织已有知识结构使之不断改善自身性能的学科。

机器学习算法在计算机视觉、数据挖掘自然信息处理、个性化推荐等领域具有广泛的应用,不仅是计算机科学与技术、人工智能、数据科学领域专业人士的常用手段,还成为各行各业解决实际问题的有力工具。

书名:机器学习导论与实践

ISBN:9787302649281

饶泓 主编

徐子晨 邱睿韫 副主编

价格:59.8元

通俗易懂的机器学习入门教材

介绍机器学习的基础理论、模型与经典方法

推荐理由:本书深入浅出地介绍了机器学习的核心算法,为每个算法精心设计了应用案例,并基于Python 给出相应算法案例的实现代码,通过对基本理论的介绍和案例的设计与实现,读者能对机器学习基本算法有一个较深入的理解,并能理论联系实际建立起使用机器学习方法解决实际问题的思路。由于深度学习近年来在众多领域取得了飞跃性的进步和突破,解决了传统方法难以解决的问题,本书给出一定的篇幅专门介绍深度学习理论。飞桨是百度提供的国内首个开源深度学习框架,是最适合中国开发者和企业使用的深度学习工具,本书基于飞桨框架给出了深度学习应用案例的设计与实现过程。

本书适用于但不局限于对人工智能和机器学习算法感兴趣的读者,适合作为高等院校计算机科学与技术、人工智能、数据科学等专业相关课程的教材和人工智能通识教育的教材,也可供广大IT从业人员参考。

本教材共15章,主要内容包括机器学习基本概念、机器学习涉及的技术、机器学习中一些常见的算法及应用、机器学习中的常用工具等。全书提供了大量应用实例,每章后均附有习题。本教材特色在于通过机器学习开发案例,熟练运用python语言和机器学习来解决实际问题。

第一篇:机器学习开发基础

着重介绍了机器学习基本理论和Python基础语法。本篇包括1章:

第1章 绪论

介绍了机器学习基本理论和Python基础语法。机器学习简单来讲就是让机器从历史数据中学习知识,并用所获得的知识去解决相应问题的过程。机器学习过程中涵盖了概率论知识、统计学知识、近似理论知识和复杂算法知识,研究如何有效利用信息,从海量的数据中获得隐藏的、高效的、可理解的知识。从算法角度出发,机器学习算法是一类从数据中获得规律,并利用规律对未知数据进行预测的算法。机器学习支持用户向计算机输入大量数据,然后让计算机分析这些数据,并根据数据训练模型。在整个过程中,模型会不断进行调整从而改进未来决策。例如俗语“朝霞不出门,晚霞行千里”便体现了这种学习的思想,人们根据每天的观察和总结不断调整经验的归纳,慢慢“训练”出这样一种能够分辨是否下雨的“分类器”。

第二篇:机器学习中一些常见的算法及应用

着重介绍机器学习中一些常见的算法及应用,即线性模型、k-近邻算法、决策树、支持向量机等。通过体系化的理论学习,为机器学习的深度应用做好知识储备。本篇包括8章:

第2章 线性模型

介绍了线性模型的基本形式,在这之后引入了线性回归和逻辑回归,并给出了线性回归和逻辑回归对应的应用实例。

第3章 朴素贝叶斯

从朴素贝叶斯相关统计学知识、朴素贝叶斯法的学习与分类对朴素贝叶斯法进行介绍,并给出了一个关于朴素贝叶斯法的应用实例来进行实际操作。

第4章 k-近邻算法

以一个十分经典的数据集Iris(鸢尾花)为例讲解k-近邻算法。首先探讨k-近邻算法基本理论以及如何使用距离度量的方法来分类物品;其次使用Python从文本文件中导入并解析数据;最后利用实际的例子讲解如何使用KNN算法进行鸢尾花分类。

第5章 决 策 树

着重介绍了决策树的基本概念、决策树学习基础算法,根据什么原则选择最优属性以及对决策树的剪枝处理,最后通过一个具体应用实例来进一步熟悉和掌握决策树算法。决策树算法包括传统的ID3算法,改进后的C4.5算法以及CART剪枝算法。C4.5和CART是目前最为流行的算法,但是为了让读者更好理解决策树,本章重点使用ID3算法来演示具体应用实例。

第6章 支持向量机

介绍了支持向量机(SVM)的一些基本概念、关键术语以及一些理论基础。同时重点讲述了SVM目前最流行的一种实现方法序列最小优化(SMO)算法。

第7章 神经网络

通过神经元模型、感知机与多层网络、BP神经网络以及相应的应用实例四大板块,介绍了神经网络相关知识。

第8章 深度学习

向读者介绍了深度学习有关知识。深度学习是机器学习的一个分支,是一种以人工神经网络为架构,对数据进行表征学习的算法。深度学习方法的发展为计算机视觉和机器学习带来了革命性的进步,新的深度学习技术不断诞生,人工智能的快速发展离不开深度学习技术的发展。由于篇幅有限,本章从卷积神经网络(CNN)、循环神经网络(RNN)、深度学习框架以及具体应用实例对深度学习进行了介绍。

第9章 集成学习方法

首先讨论了不同分类器的集成方法,然后主要关注Boosting方法及其代表分类器AdaBoost,和现在业界主流的XGBoost分类器。最后分别用AdaBoost分类器和XGBoost分类器完成两个应用实例。

第三篇 无监督学习

与前面所介绍的分类方法不同,在无监督学习中,对于训练集数据是不知道其真实标签的,因此类似分类和回归中的目标变量事先并不存在。与前面“对输入数据 X 来预测变量 Y”不同的是,无监督学习中要回答的问题是:“能够从数据X中发现什么?”。本篇包括3章:

第10章 K- 均值聚类

对K-均值聚类进行探究,首先介绍k-均值聚类算法并对k-均值算法中存在的一些缺陷进行讨论。为了解决其中存在的一些缺陷,可以通过后续的处理来产生更好的簇;其次介绍二分k-均值算法;最后给出一个应用K-均值聚类算法的应用实例来加强对算法的理解和掌握。

第11章 Apriori 算法及关联分析

讨论了从数据集中获取有趣信息的两种方法——发现频繁项集以及关联规则。详细介绍了Apriori算法及其关联分析。首先详细介绍了关联分析,然后讨论Apriori原理。因为Apriori算法正是基于该原理得到的,接下来便利用Apriori算法来发现频发集并从频繁集中抽取关联规则。在本章最后给出了一个应用实例来演示Apriori算法的应用。

第12章 FP-growth算法及频繁项集的挖掘

继续讨论发现频繁项集这一任务。FP-growth算法虽然能够有效提升发现频繁项集的速度,但该算法不能够用于发现关联规则。本章从FP树介绍、构造FP树、从FP树中挖掘频繁项集来介绍FP-growth算法及频繁项集的挖掘,最后展示了一个应用FP-growth算法的应用实例。

第四篇 机器学习中的其他常用工具

本篇介绍一些机器学习实践中的其他常用工具,这些工具可以用在前面介绍的机器学习算法中。在前面的实践中,都是将数据直接拿来使用而没有对数据进行一个属性简化处理。在实际生活中,所研究的数据往往是受到许多因素的影响,数据中带有很多变量,比如研究房价的影响因素,需要考虑的变量有物价水平、市民的薪资水平、土地价格、利率、该城市的消费水平、城市化率等。变量和数据都很多,但是其中存在着噪音和数据冗余。数据处理的目标是剔除数据中的噪声和降低数据的冗余,提高机器学习方法的性能本篇包括2章:

第13章 PCA及数据降维

介绍了一种按照方差最大方向调整数据的主成分分析(PCA)降维方法。首先对降维技术进行一个简要概述,然后详细介绍PCA,在本章的最后通过一个具体的应用实例来展示PCA的工作过程。

第14章 奇异值分解及应用

对奇异值分解(SVD)进行了一个大致介绍,包括奇异值分解的应用以及矩阵分解的相关知识,最后介绍了基于Python的SVD实现的一个应用实例。

第五篇 综合实例

本篇包括1章:

第15章 综合实例

主要引入四个综合实例,一个是基于线性回归、随机森林、支持向量回归等数学模型进行疫情现状分析的综合实例,一个是关于基于用户的协同过滤算法的个性化推荐综合实例,另外两个则是利用百度深度学习框架实现的基于深度学习的个性化电影推荐算法以及一个使用DQN网络的强化学习模型。

机器学习具有多学科交叉的特点,是当前学术界和工业界均关注的热点领域,其应用范围十分广泛,已经成为一种解决诸多问题的有效工具。本书以理工科高年级本科生和低年级研究生的基础知识为立足点,以面向工程应用为目标,是一本综合性的机器学习教程。

本书既反映机器学习的基础知识和经典方法,又重视深度学习和强化学习的知识内容,使读者不仅能在机器学习领域打下坚实的基础,同时也可以利用所学知识解决遇到的实际问题并进入学科前沿。本书的主要内容包括:

向上滑动阅览

第 1 章 绪 论

1.1 机器学习的定义

1.2 基本术语

1.3 模型评估与选择

1.3.1 经验误差与过拟合

1.3.2 评估方法

1.4 机器学习解决问题的基本思路

1.5 Python 语言

1.5.1 Python 简介

1.5.2 Python 基础语法

1.5.3 NumPy 快速入门

1.5.4 Matplotlib快速入门

1.6 习题

第 2 章 线性模型

2.1 基本形式

2.2 线性回归

2.3 逻辑回归

2.3.1 Logistic分布

2.3.2 逻辑回归与Sigmoid 函数

2.3.3 基于最优化方法确定最佳回归系数

2.4 应用实例

2.4.1 线性回归——波士顿房价预测

2.4.2 逻辑回归——从疝气病症预测病马的死亡率

2.5 习题

第 3章 朴素贝叶斯

3.1 朴素贝叶斯相关统计学知识

3.2 朴素贝叶斯法的学习与分类

3.2.1 基本方法

3.2.2 后验概率最大化的含义

3.2.3 朴素贝叶斯分类基本流程

3.3 极大似然估计

3.4 应用实例——PC 评论分类

3.5 习题

第 4 章 k-近邻算法

4.1 k-近邻算法概述

4.2 kNN 算法主要步骤

4.2.1 距离度量

4.2.2 k值的选择

4.2.3 分类决策

4.3 应用实例——鸢尾花分类

4.3.1 项目背景

4.3.2 读取数据与数据可视化

4.3.3 划分数据集

4.3.4 kNN 算法

4.3.5 如何测试分类器

4.4 习题

第 5 章 决 策 树

5.1 决策树的基本概念

5.1.1 定义

5.1.2 决策树的构造

5.2 决策树学习基础算法

5.3 最优属性的选择

5.3.1 ID3——信息增益(Gain)

5.3.2 C4.5——信息增益率(Gain_ratio)

5.3.3 CART——基尼指数(Gini_index)

5.4 决策树的剪枝

5.5 应用实例——性别决策

5.6 Python 实现过程

5.6.1 计算给定数据集的信息熵

5.6.2 数据集的划分

5.6.3 递归构建决策树

5.7 使用 Matplotlib 绘制决策树

5.7.1 Matplotlib 注解

5.7.2 绘制决策树

5.8 习题

第 6 章 支持向量机

6.1 基于最大间隔分隔数据

6.2 寻找最大间隔

6.2.1 拉格朗日对偶性

6.2.2 SMO 算法

6.3 软间隔最大化

6.4 核函数

6.5 径向基函数

6.6 应用实例

6.7 习题

第 7 章 神经网络

7.1 神经元模型

7.2 感知机与多层前馈神经网络

7.2.1 感知机

7.2.2 多层前馈神经网络

7.3 B P 神 经 网 络

7.4 其他常见神经网络

7.4.1 RBF 网络

7.4.2 ART 网络

7.4.3 SOM 网络

7.4.4 级联相关网络

7.4.5 Elman 网络

7.5 应用实例——从疝气病症预测病马的死亡率

7.5.1 处理数据中的缺失值

7.5.2 用 B P神经网络进行预测

7.6 习题

第 8 章 深度学习

8.1 卷积神经网络

8.2 典型的卷积神经网络

8.2.1 LeNet

8.2.2 AlexNet

8.2.3 VGGNet

8.2.4 ResNet

8.3 循环神经网络

8.4 深度学习框架

8.4.1 深度学习框架的作用

8.4.2 常见的深度学习框架

8.4.3 飞桨概述——深度学习开源平台 PaddlePaddle

8.5 线性回归小实例在飞桨深度学习平台的应用

8.6 深度学习应用实例——口罩识别

8.7 习题

第 9 章 集成学习方法

9.1 集成学习的分类

9.2 Bagging 和随机森林

9.2.1 Bagging 并行集成学习

9.2.2 随机森林

9.3 Boosting 集成学习方法

9.4 基于 AdaBoost 的分类

9.5 基 于XGBoost 的分类

9.5.1 GBDT

9.5.2 XGBoost

9.6 应用实例

9.6.1 基于 AdaBoost 算法

9.6.2 基于XGBoost 算法

9.7 习题

第 1 0 章 K- 均值聚类

10.1 K-均值聚类算法

10.1.1 模型

10.1.2 算法

10.1.3 算法特性

10.2 二分 K-均值算法

10.2.1 使用后处理来提高聚类性能

10.2.2 二分 K-均值聚类算法

10.3 应用实例

10.4 习题

第 1 1 章 Apriori 算法及关联分析

11.1 关 联 分 析

11.1.1 频繁项集的评估标准

11.1.2 关联分析算法过程

11.2 Apriori 算法基本原理

11.3 使用 Apriori 算法来发现频繁项集

11.4 从频繁项集中挖掘关联规则

11.5 应用实例

11.6 习题

第 1 2 章 FP-growth 算法及频繁项集的挖掘

12.1 F P 树 介 绍

12.2 构造 FP 树

12.2.1 头指针表的建立

12.2.2 FP树的建立

12.3 从 FP 树中挖掘频繁项集

12.3.1 抽取条件模式基

12.3.2 FP算法归纳

12.4 应用实例

12.5 习 题

第 1 3 章 PCA 及数据降维

13.1 降 维 技 术

13.2 PCA 技 术

13.2.1 PCA 的推导:基于最小投影距离

13.2.2 PCA 的推导:基于最大投影方差

13.2.3 PCA 算法流程

13.3 应 用 实 例

13.4 习 题

第 14 章 奇异值分解及应用

14.1 奇异值分解的应用

14.1.1 隐形语义索引

14.1.2 推荐系统

14.2 奇异值分解原理

14.2.1 特征值与特征向量的回顾

14.2.2 奇异值分解的定义

14.2.3 紧奇异值分解与截断奇异值分解

14.3 应用实例

14.3.1 观影数据的生成

14.3.2 基于协同过滤的推荐引擎

14.3.3 基于物品的相似度和基于用户的相似度

14.3.4 示例:电影推荐引擎

14.4 习 题

第 1 5 章 综合实例

15.1 综合实例一

15.2 综合实例二

15.3 综合实例三

15.4 综合实例四

参考文献


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1