本方案适用于cser,对ai深入学习
机器学习用到的数学知识相当广泛,以西瓜书为例,介绍每章所需要的数学知识,没有数学寸步难行...
第一章:多元随机变量分布、函数分布、期望->NFL
第二章:期望、方差,最难的就是假设检验了,不会假设检验,就会看的头大,正态分布,两个重要极限
第三章:矩阵求导,无约束的条件极值,矩阵的秩,极大似然估计,凸优化的牛顿法,二范数
第四章:信息论中的信息熵
第五章:矩阵乘法,凸优化的梯度下降法,偏导数以及复合函数偏导数
第六章:拉格朗日对偶,拉格朗日乘子
第七章:贝叶斯方法、极大似然估计、统计推断
第八章:相关性。
与其说是高等数学不如说是多元微积分,多元微积分更重要一些,尤其是链式求导法,在深度学习中理解反向传播会非常有用,但一元的求导,求极限也需要。至于微分方程和无穷级数、曲线曲面积分,反而没那么重要了。需要重点学最小二乘法,条件极值,拉格朗日乘子法,方向导数,梯度(为了理解梯度下降),几何,雅可比行列式
从高等数学角度理解最小二乘法
重点学一元微积分和多元微积分,微分方程和曲线积分,级数,微分方程不需要学
重点学习他的插值和泰勒公式。
书籍:
《同济七版高等数学》,我觉得这本高数书非常好,在国内教材中,少见好教材,无论是证明还是课后的习题。
需要重点学矩阵乘法、矩阵求导,QR分解,奇异值(SVD)分解,范数,向量空间,线性映射。
从矩阵角度理解一元线性回归,即最小二乘问题
国内好的线代课不多,我当时学只有一个学期,课时很少,学了个皮毛,后面考研又深入学了学,这门课对以后的机器学习非常重要。机器学习很多公式推导都需要它。
极力推荐,没有几何,代数学的就很吃力。
矩阵求导在大部分高等代数/线性代数课里面讲的都不是很深入
需要补充范数和svd分解,qr分解,范数,线性映射,线性空间
书籍:
《线性代数及其应用》David C. Lay,从应用角度比同济的要好,写的也很棒
概率统计在机器学习中非常重要尤其是模型评估和选择、和贝叶斯分类器。重点学参数估计,尤其是最大似然和贝叶斯估计、最大后验估计,假设检验,贝叶斯方法,一元线性回归
从概率统计角度理解一元线性回归
概率论:
讲的很透彻,首推
结合python讲统计学,学完这门课对于python也会有一定帮助
书籍推荐
概率论与数理统计,陈希儒,这本书写的相当好,个人认为好于浙大版本的数理统计。对于很多东西讲的很透彻,与之相比,反而浙大那个更像是应付考试出的书了。
概率论与数理统计教程,更全一些,一些统计学考研会用到教材
随机过程
SVM需要用到它的拉格朗日对偶、拉格朗日乘子法、凸优化,梯度下降法、牛顿法
书籍:
Stephen Boyd / 王书宁 ,讲的很全面了,书也很厚
交叉熵、KL散度
以下四个教程均来自同一个up讲的很不错,学习机器学习必看,python学习也相对简单
题库
牛客网 python入门or CS61A题库
学完后做一些oj题目,对于熟悉语法有些帮助
机器学习大部分工作是在做数据处理(特征工程),所以数据分析代码底子越好,写机器学习代码越轻松,因为有sklearn以后模型的训练、测试很简单了。
numpy
pandas
mataplotlib:可视化包
视频学习资源
练习网站
牛客网python数据分析
新手推荐先看统计学习方法,个人感觉比西瓜书容易理解。很像一本数学书。不至于公式跳步,也更容易抓住重点,西瓜书看完一章需要自己总结。机器学习和计算机其他课程不一样很容易看不懂,可以先打个问号,往后读,然后每周抽出固定时间集中解决问号。
这门课程是配套统计学习方法的,感觉讲的很不错。尤其是朴素贝叶斯方法那块
然后就是西瓜书+南瓜书,南瓜书可以看电子版的。遇到那个公式不懂查一下。
,这本书要求数学功底有点高,难度高,但好处是详细,但是她是深入必备书籍。
有很详细的公式推导,有很多学习方法有很多角度理解比如线性回归。很精彩。但朴素贝叶斯有所不足。可以用那个视频互为补充。
有了前面基础,代码其实很简单。可以看黑马or百战机器学习,我个人是看百战的。搜搜云盘、论坛应该能找到。代码非常模板化。新手可以直接上手用sklearn。
通用步骤就是
导入数据
数据预处理
特征工程
训练
预测
新手推荐神经网络与深度学习by丘锡鹏+
这个老师讲的很不错,和书本配套,NNDL相比与花书简练很多。也更容易抓住重点
花书+中科大的
看过NNDL以后再看花书应该很轻松了
其他
李宏毅老师的机器学习(虽说是机器学习但大部分内容是深度学习啦)
首推刘二大人的
后续打算学NLP和知识图谱,学完在更新。更多内容可以参考我的收藏夹