深入理解机器学习：从原理到算法 pdf版，机器学习必备书籍

作者：编程小怼怼发布时间：2023-06-29

本书涵盖了机器学习领域中的严谨理论和实用方法，讨论了学习的计算复杂度、凸性和稳定性、PAC-贝叶斯方法、压缩界等概念，并介绍了一些重要的算法范式，包括随机梯度下降、神经元网络以及结构化输出。

全书讲解全面透彻，适合有一定基础的高年级本科生和研究生学习，也适合作为IT行业从事数据分析和挖掘的专业人员以及研究人员参考阅读。

作者简介:
以色列希伯来大学副教授Shai ShalevShwartz和加拿大滑铁卢大学教授Shai BenDavid的专著《Understanding Machine Learning:From Theory to Algorithms》是机器学习领域一部具有里程碑意义的著作。

近几年，机器学习是人工智能研究领域中最活跃的分支之一，已成为信息科学领域解决实际问题的重要方法，它的应用已遍及人工智能的各个应用领域。

机器学习又是一个多学科的交叉领域，涉及数学、自动化、计算机科学、应用心理学、生物学和神经生理学等。

这种学科交叉融合带来的良性互动，无疑促进了包括机器学习在内的诸学科的发展与繁荣。

本书内容十分丰富，作者以前所未有的广度和深度，介绍了目前机器学习中重要的理论和关键的算法。

本书没有陷入“科普”式的堆砌材料的写作方式，由于作者是该领域的权威专家，因此在介绍... 以色列希伯来大学副教授Shai ShalevShwartz和加拿大滑铁卢大学教授Shai BenDavid的专著《Understanding Machine Learning:From Theory to Algorithms》是机器学习领域一部具有里程碑意义的著作。

机器学习又是一个多学科的交叉领域，涉及数学、自动化、计算机科学、应用心理学、生物学和神经生理学等。

这种学科交叉融合带来的良性互动，无疑促进了包括机器学习在内的诸学科的发展与繁荣。

本书内容十分丰富，作者以前所未有的广度和深度，介绍了目前机器学习中重要的理论和关键的算法。

本书没有陷入“科普”式的堆砌材料的写作方式，由于作者是该领域的权威专家，因此在介绍各种理论和算法时，时刻不忘将不同理论、算法的对比与作者自身的研究成果传授给读者，使读者不至于对如此丰富的理论和算法无所适从。

另外，特别值得指出的是，本书第一部分非常有特色，也是非常重要的一部分。

这部分内容从更高的观点和更深的层次探讨机器学习的许多理论基础，引入对指导理论研究和实际应用都至关重要的概率近似正确（Probably Approximately Correct，PAC）学习理论。

该理论旨在回答由机器学习得到的结果到底有多高的可信度与推广能力，从某种意义上来说，只有懂得了该部分，才可能透彻地理解和更好地运用其他章节的内容。

国内关于PAC学习的资料非常少，在翻译过程中团队成员碰到了极大的困难，我们人工智能与机器学习研究团队为此进行了多方论证并多次召开专题讨论会。

本书主要面向人工智能、机器学习、模式识别、数据挖掘、计算机应用、生物信息学、数学和统计学等领域的研究生和相关领域的科技人员。

翻译出版中译本的目的，是希望能为国内广大从事相关研究的学者和研究生提供一本全面、系统、权威的教科书和参考书。

如果能做到这一点，译者将感到十分欣慰。

必须说明的是，本书的翻译是中国科学院自动化研究所人工智能与机器学习研究团队集体努力的结果，团队的成员杨雪冰、匡秋明、蒋晓娟、薛伟、魏波、李思园、张似衡、曾凡霞、于廷照、王鑫、李涛、杨叶辉、胡文锐、张志忠、唐永强、陈东杰、何泽文、张英华、李悟、李硕等参与了本书的翻译工作，李思园老师参与了全书的审校与修正。

感谢机械工业出版社华章分社的大力协助，倘若没有他们的热情支持，本书的中译版难以如此迅速地与大家见面。

另外，本书的翻译得到了国家自然科学基金委重点项目和面上项目（61472423、U1135005、61432008、61532006、61305018、61402481等）的资助，特此感谢。

在翻译过程中，我们力求准确地反映原著内容，同时保留原著的风格。

但由于译者水平有限，书中难免有不妥之处，恳请读者批评指正。

最后，谨把本书的中译版献给我的博士生导师王珏研究员！

王珏老师生前对机器学习理论、算法和应用非常关注，对于PAC可学习理论也有着独到而深刻的理解，他启发并引领了我们研究团队对机器学习理论和算法的研究工作，使我们终身受益。

中国科学院自动化研究所张文生 2016年4月于北京

目录:
第1章引论1
第2章简易入门10
第3章一般学习模型17
第4章学习过程的一致收敛性24
第5章偏差与复杂性权衡28
第6章VC维33
第7章不一致可学习44
第8章学习的运行时间56
第9章线性预测66
第10章boosting75
第11章模型选择与验证85
第12章凸学习问题93
第13章正则化和稳定性104
第14章随机梯度下降114
第15章支持向量机127
第16章核方法136
第17章多分类、排序与复杂预测问题145
第18章决策树162
第19章最近邻167
第20章神经元网络174
第21章在线学习186
第22章聚类201
第23章维度约简212
第24章生成模型226
第25章特征选择与特征生成237
第26章拉德马赫复杂度250
第27章覆盖数260
第28章学习理论基本定理的证明263
第29章多分类可学习性271
第30章压缩界277
第31章PAC贝叶斯281