本书基于 Python
语言,结合实际的数据集,介绍了机器学习算法以及数据分析方法的应用。本书主要包含两部分内容,第一部分为 Python
机器学习入门知识:主要介绍了 Python
基础内容、Numpy
与Pandas
库数据操作、Matplotlib
与Seaborn
库数据可视化、Sklearn
库机器学习,以及与机器学习相关的基础知识;第二部分为 Python
机器学习算法应用:主要介绍了数据的回归预测分析、时间序列预测,数据无监督学习中的聚类、降维以及关联规则,数据分类模型的应用以及针对文本数据与网络图数据的机器学习算法应用。
本书以“边动手边学习”的方式,用简洁直观、注释细致的代码呈现了机器学习的分析方法与一般流程,尤其针对机器学习相关模型与算法的应用与评估,以一个个基于生活场景的实战案例来进行演示,可以帮助读者更好地理解数据场景,并应用机器学习开展相关工作。本书尽可能避开复杂公式,即使没有 Python
基础、机器学习基础知识的读者也能看懂本书的内容,对初学者非常友好。此外,本书的代码通过 Jupyter Notebook进行演示与分析,可便于读者对程序进行复现、对结果进行分析。
本书适合对机器学习、数据分析感兴趣的初学者,也可作为 Python
机器学习、数据分析、数据可视化的入门及进阶的教材。
本书共分为10
个章节,循序渐进地介绍了 Python
机器学习的入门基础、算法应用以及实战等内容。各章主要内容如下。
第1 章:Python机器学习快速入门。从通过Anaconda安装 Python
开始,然后介绍 Python
的基础内容,以及 Python
中的控制语句与函数等语法的使用,最后简单介绍了与机器学习相关的基础知识,以及机器学习算法的分类与应用场景。本书涉及的机器学习算法与应用主要包括:
第2章:Python中的常用库。介绍了 Python
在机器学习应用中非常重要的5个第三方库的使用,分别是:数据操作和处理库(Numpy
、Pandas
)、数据可视化库:Matplotlib
、Seaborn
,以及机器学习库Sklearn
。
第3章:机器学习流程—以种子数据为例。以一个种子数据集为例,介绍了不同应用场景下的机器学习过程,分别包括:数据预处理与可视化探索、无监督学习的数据降维与聚类、有监督学习的数据分类与回归,以及半监督学习分类等。
第4 章:模型的选择与评估。主要介绍在机器学习过程中,如何判断模型是否过拟合,如何使用交叉验证与参数网格搜索选择合适的模型,以及在分类、回归、聚类应用中的模型效果评价指标的选择。
第5 章:回归模型。主要介绍使用 Python
实现回归模型的建立和应用。例如:建立一元线性回归、多元线性回归、Lasso回归分析等,同时针对时间序列数据介绍了ARIMA
模型与SARIMA
模型的应用。
第6章:无监督模型。主要介绍数据降维、数据聚类以及关联规则等机器学习算法。与相应的数据集相结合,使用 Python
实现相关经典算法的应用。
第7章:分类模型。主要介绍几种经典分类算法的应用,使用决策树算法、随机森林、逻辑回归算法进行泰坦尼克号数据分类,使用支持向量机与人工神经网络对手写数字进行的识别。
第8章:高级数据回归算法。本章节介绍一些较高级的回归算法应用,例如:随机森林、GBDT
、支持向量机、神经网络等算法的回归应用;针对时间序列数据,使用Prophet
算法、VAR
、VARMA
等算法进行预测。
第9章:非结构数据机器学习。本章节介绍使用 Python
对文本数据分析与网络图数据进行分析。例如:文本数据特征提取、聚类与分类等,网络图数据可视化与聚类。
第10章:综合实战案例:中药材鉴别。本章节介绍一个真实的数据机器学习应用案例,主要包含:无监督学习鉴别药材种类、有监督学习鉴别药材产地、半监督学习鉴别药材种类等内容。
本书在编写时使用相关资源的最新版本库,但是由于 Python
以及相关库的迅速发展,以及作者水平有限,且编写时间仓促,书中难免存在疏漏,敬请读者不吝赐教。也欢迎加入QQ群一起交流,QQ群号:434693903。
当当:https://product.dangdang.com/11573268886.html
京东:https://item.jd.com/10090826879026.html
关注微信公众号:Adam大数据分析小站,发送 抽奖
参与抽奖活动。会在2023年11月23日自动抽取5名幸运参与者,每人会送《Python机器学习基础、算法与实战》一本。
注意:奖品会通过邮寄的方式发放,中奖后请及时在抽奖助手填写收货人的相关信息,确保奖品的顺利领取。