导读
最近再整理机器学习资料时,发现了一个很好的资源,虽然内容不是很有深度,但贵在全面,是入门的不错参考,现将pdf整理给大家。
关注微信公众号:人工智能大讲堂,后台回复“MLS”获取资料,资料是英文的,如需中文翻译请联系我,根据实际情况后续安排翻译工作。
每个主题组都对应一个文件夹,主题组中的每个主题都对应一个pdf。
主题组
(微积分)Calculus
(线性代数)Linear Algebra
(概率)Probability
(统计)Statistics
(数据)Data
(模型和建模)Models and Modeling
(三角函数)Trigonometry
(图)Graphs
(计算系统)Computing Systems
(组织)Organization
(编程结构)Programming Constructs
(微积分)Calculus
微积分是研究连续变化的学科。现代微积分是由艾萨克·牛顿和戈特弗里德·莱布尼茨在17世纪开发的。
—
微积分提供了比简单枚举更有效地计算变化的方程。因为机器学习在变化计算方面依赖性很强,微积分提供的效率是必不可少的。
—
训练机器学习模型并使用这些模型进行预测涉及到变化的测量,微积分在这些操作中被广泛使用。
主题
Activation Functions
Differential Calculus
Euler’s Number
Gradients
Integral Calculus
Logarithms
Rectifier Activation Function
Sigmoid Activation Function
Stochastic Gradient Descent
Tanh Activation Function
———
激活函数
微分学
欧拉数
梯度
积分学
对数
整流器激活函数
Sigmoid激活函数
随机梯度下降
Tanh激活函数
(线性代数)Linear Algebra
包括用于计算的算法:
标量
向量和向量空间
特征值和特征向量
矩阵和矩阵运算
———
线性代数在 ML 中的应用包括:
损失计算
自然语言处理
图像处理
降维
主题
Concatenation
Convolution
Eigenvalues and Eigenvectors
Linear Equations
Linear Vector Projection
Masking
Matrices
Pooling
Scalars
Scaling
Softmax Function
Vectors
———
连接
卷积
特征值和特征向量
线性方程
线性向量投影
掩蔽
矩阵
池化
标量
缩放
Softmax 函数
向量
(概率)Probability
概率算法计算以下事件发生的可能性:
事件发生的可能性
特征发生的可能性
主题
Central Limit Theorem
Cross Entropy Loss
Entropy
Independent Events
Law of Large Numbers
Mutually Exclusive Events
Normal Distribution
Poisson Distribution
Probability Density Function
Probability Measure
P-Value
———
中心极限定理
交叉熵损失
熵
独立事件
大数定律
互斥事件
正态分布
泊松分布
概率密度函数
概率度量
P值
(统计)Statistics
提供理解和解释机器学习的能力:
输入数据
模型训练结果
预测结果
主题
Accuracy
A/B Testing
Bias
Bias-Variance Tradeoff
Confidence
Confusion Matrix
Correlation
Deviation
Dispersion
Estimator
Fairness
Loss (Cost) Function
Mean Squared Error
Hypothesis
Prediction and Inference
Repeatability
Standard Deviation
Statistical Power of a Test
Variance
———
准确度
A/B 测试
偏差
偏差-方差均衡
置信度
混淆矩阵
相关性
偏差
离散度
估计器
公平性
损失(成本)函数
均方误差
假设
预测和推断
可重复性
标准偏差
检验的统计功效
方差
(数据)Data
提供数据的高效处理:
存储
索引
编目
修改
检索
消费
呈现
主题
Columnar Databases
CSV Data
Data Cleaning
Data Discovery
Data ETL
Data Flow
Data Lake
Data Pipeline
Data Visualization
Dimensionality Reduction
Document Databases
Extrapolation
Factor Analysis
Graph Databases
Interpolation
JSON
Normalization
Outliers
Principal Components Analysis
Relational Databases
Sampling
Signal Processing
———
列式数据库
CSV 数据
数据清洗
数据探索
数据 ETL
数据流
数据湖
数据管道
数据可视化
降维
文档数据库
外推
因子分析
图形数据库
内插
JSON
规范化
异常值
主成分分析
关系型数据库
抽样
信号处理
(模型和建模)Models and Modeling
模型和建模提供了工具,用于创建能够预测现实世界中条件和行动的算法。
Topics
Algorithm Libraries
Artificial Neural Networks
Attention
Automated Machine Learning
Backpropagation
Causal Embedding
Classification
Cluster Analysis
Collaborative Filtering
Convolutional Neural Networks
Cross Decomposition
Curve Fitting
Decision Trees
Deep Learning
Deep Reasoning
Ensemble Learning
Feature Selection
Fourier Analysis
Gaussian Analysis
Generative Adversarial Networks
Gradient Boosting
Histogram of Oriented Gradients
Image Processing
K-Means Clustering
Linear Regression
Logistic Regression
Long Short-Term Memory
Markov Chains
Model Categories
Modeling Process
Naive Bayes
Nearest Neighbors
Probabilistic Graphical Models
Random Forest
Recurrent Neural Networks
Regression Analysis
Regularization
Reinforcement Learning
Supervised Learning
Support Vector Machines
Transformer Neural Networks
Unsupervised Learning
Word Embedding
———
算法库
人工神经网络
注意力机制
自动化机器学习
反向传播
因果嵌入
分类
聚类分析
协同过滤
卷积神经网络
交叉分解
曲线拟合
决策树
深度学习
深层推理
集成学习
特征选择
傅里叶分析
高斯分析
生成对抗网络
梯度提升
方向梯度直方图
图像处理
K 均值聚类
线性回归
逻辑回归
长短时记忆网络
马尔可夫链
模型分类
建模过程
朴素贝叶斯
最近邻算法
概率图模型
随机森林
循环神经网络
回归分析
正则化
强化学习
监督学习
支持向量机
Transformer 神经网络
无监督学习
词嵌入
(三角函数)Trigonometry
这个单词源于希腊语“三角形”和“测量”。
——
三角学提供了计算形状特征之间的关系的方法,更具体地说,是三角形边长和角度之间的关系。
主题
Cosine Similarity
Periodic Functions
Trigonometric Functions
———
余弦相似性
周期函数
三角函数
(图)Graphs
提供数学构造,用于:
数据关系
数据流
处理节点
机器学习模型的结构
主题
Graph Activation Node
Graph Backpropagation Data Flow
Graph Convolution Node
Graph Data Operations Node
Graph Deep Learning Data Flow
Graph Dropout Node
Graph Feed Forward Data Flow
Graph Input Node
Graph Matrix Operation Node
Graph Memory Node
Graph Output Node
Graph Pooling Node
Graph Recurrent Data Flow
———
图激活节点
图反向传播数据流
图卷积节点
图数据操作节点
图深度学习数据流
图丢弃节点
图前馈数据流
图输入节点
图矩阵运算节点
图记忆节点
图输出节点
图池化节点
图循环数据流
(计算系统)Computing Systems
"计算系统为机器学习软件提供平台。
—
像高级中央处理器和图形处理器这样的系统的进步,显著提高了机器学习软件的性能。"
“机器学习的很多进展——这在学术界是不受欢迎的观点——都是由于计算能力和数据量的增加所推动的。一个类比是建造太空火箭:你需要一个巨大的火箭发动机,同时需要大量的燃料。”
— 吴恩达
主题
Application Programming Interface
Big O Notation
Client-Server Architecture
Cloud Computing
DOM
Exponential growth
HTML iframe
Internet Protocol Suite
P Versus NP Complexity
Web Crawler
———
应用程序接口
大 O 表示法
客户端-服务器架构
云计算
文档对象模型
指数增长
互联网协议套件
P 与 NP 复杂度
网络爬虫
(组织)Organization
如何组织和管理机器学习。
主题
Agile Processes
Business Model Components
Functional Groups
———
敏捷过程
商业模型组成部分
功能组
(编程结构)Programming Constructs
编程结构为构建机器学习代码提供了基本元素。
主题
Abstraction
Array
Attribute
Best-first Search
Binary Search
Block
Branch
Callback
Class
Conditional
Constructor
Container/Collection
Dynamic Array
Encapsulation
Exception
Expression
Function
Garbage Collection
Greedy Algorithms
Hash
HTTP Request
Identifier
Inheritance
Inner Class
Instance
Iterator
Keyword
Lambda
List
Linked List
Literal
Metaclass
Method
Mixin
Object
Operator
Overloading
Overriding
Package
Parameter
Polymorphism
Primitive
Programming Process
Recursion
Regular Expression
Reserved Word
Return
Sort
Statement
Switch
Table
This/Self
Token
Type
Variable