【机器学习基础】超全汇总！机器学习常用术语词汇表（建议收藏）

作者：曾开心哈发布时间：2024-10-18

刚接触机器学习框架 TensorFlow 的新手们，这篇由 Google 官方出品的常用术语词汇表，一定是你必不可少的入门资料！本术语表列出了基本的机器学习术语和 TensorFlow 专用术语的定义，希望能帮助您快速熟悉 TensorFlow 入门内容，轻松打开机器学习世界的大门。

（完整版PDF文末领取）

算法与模型相关

强化学习

智能体（agent）在环境中进行一系列动作，通过获得奖励来学习最优的行为策略，以最大化长期累积奖励。常用于机器人控制、游戏等领域。

分类算法

监督学习中的一类算法，用于将数据分为不同的类别。常见的分类算法有决策树、支持向量机、朴素贝叶斯等。

回归算法

同样是监督学习算法，用于预测连续的数值，如预测股票价格、房价等。线性回归是最基本的回归算法之一。

聚类算法

无监督学习算法，将数据对象分成不同的簇，使得同一簇内的数据对象具有较高的相似性，而不同簇之间的相似性较低。例如 K-Means 聚类算法。

决策树

一种基于树结构的算法，通过对数据的特征进行条件判断，构建决策树来进行分类或回归预测。每个内部节点是一个属性上的测试，分支是测试输出，叶节点是类别或值。

随机森林

基于决策树的集成学习算法，从原始训练数据集有放回地抽样构建多个子数据集，分别训练决策树，然后综合决策树的预测结果进行最终预测，能够提高模型的稳定性和准确性。

支持向量机（SVM）

一种二分类模型，通过寻找一个超平面来将不同类别的数据分隔开，使得数据点到超平面的距离最大化，从而实现对数据的分类。

神经网络

模仿生物大脑神经元之间的信息传递方式构建的模型，由多个神经元组成，通过调整神经元之间的连接权重来学习数据的特征和规律，是深度学习的基础。

数据相关

数据集

用于训练和测试机器学习模型的数据集合，包含多个数据样本，每个样本通常由输入特征和输出标签（在监督学习中）组成。

特征

也称为特征向量，是描述数据对象的属性或变量，是机器学习模型的输入。例如在图像识别中，图像的像素值、颜色特征等就是特征。

特征工程

对原始数据进行处理和转换，提取和构建有意义的特征，以提高模型的性能和准确性。包括数据清洗、特征选择、特征提取、特征构建等步骤。

数据清洗

处理数据集中的缺失值、异常值、重复值等问题，保证数据的质量和一致性，以便模型能够正确地学习数据中的规律。

过拟合

模型在训练数据上表现很好，但在新的未见过的数据上表现很差的现象。通常是因为模型过于复杂，学习到了训练数据中的噪声和特定模式，而无法泛化到新数据上。

欠拟合

模型在训练数据和测试数据上的表现都很差，说明模型没有很好地学习到数据中的规律和特征，通常是因为模型过于简单或训练不足。

评估指标相关

准确率（Accuracy）

分类模型中最常用的评估指标之一，计算正确分类的样本数占总样本数的比例，反映了模型对整体数据的分类准确程度。

精确率（Precision）

针对二分类问题，精确率是指预测为正类的样本中真正为正类的比例，侧重于关注预测为正类的准确性。

召回率（Recall）

也是二分类问题中的指标，召回率是指真正为正类的样本中被预测为正类的比例，强调了对正类样本的覆盖程度。

F1 值

是精确率和召回率的调和平均数，综合考虑了模型的精确性和召回能力，F1 值越高，说明模型在精确率和召回率之间取得了较好的平衡。

均方误差（MSE）

回归模型中常用的评估指标，计算预测值与真实值之间差值的平方的平均值，反映了预测值与真实值之间的差异程度。

R² 得分

衡量回归模型拟合优度的指标，表示模型能够解释因变量方差的比例，取值范围在 0 到 1 之间，R² 值越接近 1，说明模型对数据的拟合效果越好。

模型训练与优化相关

梯度下降

一种常用的优化算法，用于求解模型参数的最优值。通过计算目标函数关于参数的梯度，沿着梯度的反方向更新参数，使得目标函数值逐渐减小，直到达到最小值或收敛。

学习率

在梯度下降算法中，学习率是一个重要的超参数，决定了每次参数更新的步长。学习率过大可能导致模型无法收敛，学习率过小则会使训练过程过于缓慢。

超参数

与模型参数不同，超参数是在模型训练之前需要手动设置的参数，如神经网络的层数、每层的神经元个数、学习率等，它们会影响模型的性能和训练过程。

交叉验证

一种用于评估模型性能和选择模型超参数的方法。将数据集分成多个子集，一部分作为训练集，一部分作为验证集，通过多次不同的划分和训练，综合评估模型的性能，以减少过拟合的风险。

正则化

一种防止过拟合的技术，通过在目标函数中添加正则项，对模型的参数进行约束，使得模型的复杂度降低，从而提高模型的泛化能力。常见的正则化方法有 L1 正则化和 L2 正则化。

其他：

以上是机器学习中一部分常用的术语，了解这些术语对于深入学习和应用机器学习技术非常重要。需要完整版PDF的可通过一下方式领取：

如何获取资料：

1、一键三连+关注

2、后台回复“机器学习”即可

相关资讯

【机器学习基础】超全汇总！机器学习常用术语词汇表（建议收藏）

刚接触机器学习框架 TensorFlow 的新手们，这篇由 Google 官方出品的常用术语词汇表，一定是你必不可少的入门资料！本术语表列出了基本的机器学习术语和 TensorFlow 专用术语的定义，希望能帮助您快速熟悉 TensorFlow 入门内容，轻松打开机器学习世界的大门。（完整版PDF文末领取）算法与模型相关强化学习智能体（agent）在环境中进行一系列动作，通过获得奖励来学习最优的行为策略，以最大化长期累积奖励。常用于机器人控制、游戏等领域。分类算法监督学习中的一类算法，用于将数据分为不同的

机器学习谷歌

曾开心哈 2024-10-18

近期资讯

武汉市第三医院：建设智慧医疗体系，让群众享受便捷医疗服务

患者不仅可以用手机挂号缴费，还能通过医院的电子导医图找到自己想去的科室；医院内的自助设备，让就医服务变得更加精准高效；建设互联网医院信息平台，在线问诊等智能服务，提高了医生工作效率，提升了患者满意度……近年来，武汉市第三医院加速推进智慧医院建设和医院信息标准化建设，将数字技术应用到门诊、住院、服务等各个环节，为患者提供更为便捷的医疗服务。

极目新闻 2024-12-31

华为：2024年是原生鸿蒙的关键一年

华为轮值董事长孟晚舟在2025年新年致辞中表示，2024年是原生鸿蒙的关键一年，鸿蒙千帆计划得到了众多行业伙伴的积极响应，短短一年时间，我们就走过其它操作系统十多年的发展之路，创造了“鸿蒙速度”。此外，孟晚舟还提到，通信运营商积极拥抱AI应用创新，5G新通话成为熠熠发光的新星。

鞭牛士 2024-12-31

一加Ace 5 Pro全面评测：最具性价比的骁龙8至尊旗舰游戏水桶机皇！

在一水的骁龙8至尊版顶级旗舰机型面前，这次的Ace5Pro以最具性价比的骁龙8至尊版性能旗舰的身份来到了我们跟前。一加Ace系列一贯以性能为核心基因，专注于实用与高效，舍弃了许多不必要的附加配置，因此，3399元的起售价造就了一加Ace5Pro，也促成了这款迄今为止最具性价比的骁龙8至尊版手机的诞生。

快科技 2024-12-31

12月31日译名发布：斯里达拉·帕尼克·索马纳特

背景介绍：据《印度教徒报》网站12月31日报道，印度空间研究组织主席斯里达拉·帕尼克·索马纳特表示，印度成功发射火箭将两枚航天器送入轨道，开启了太空对接实验。索马纳特现年61岁，是一名航空航天工程师，拥有印度理工学院马德拉斯分校的博士学位。他于2022年1月出任印度空间研究组织主席，在他的领导下，印度开展了第三次探月活动。

参考消息 2024-12-31

到2027年形成一批氢能交通、发电、储能商业化应用模式

12月31日消息，工信部等三部门印发《加快工业领域清洁低碳氢应用实施方案》，其中提到，到2027年，工业领域清洁低碳氢应用装备支撑和技术推广取得积极进展，清洁低碳氢在冶金、合成氨、合成甲醇、炼化等行业实现规模化应用，在工业绿色微电网、船舶、航空、轨道交通等领域实现示范应用，形成一批氢能交通、发电、储能商业化应用模式。

南方都市报 2024-12-31

千万中国“芯” 京津冀信创集群正飞腾

12月31日，国务院国资委发布消息，在津企业飞腾信息技术有限公司（下称“飞腾公司”）自主研发的飞腾系列CPU芯片在各行业应用突破1000万片，为从端到云的各型设备提供核心算力支撑，推动国产CPU实现从“可用”向“好用”的跨越式发展。

央广网 2024-12-31

从即梦的AI文字图片能力，浅谈AI图片工具平台的未来

通过对即梦AI图片模型的测试和分析，探讨了这一技术进步如何拓展AI图片应用的场景，并预测了AI图片工具平台的未来发展。通过输入文字，在图片上增加艺术字，或者生成融入画面的字，同时会利用图片生成AI补足画面的内容。整体上效果还挺好，只可惜，不能生成中文的，导致完全不能用上这个能力。

人人都是产品经理 2024-12-31

工信部许可基础电信运营企业开展频率重耕

中新网12月31日电据工信部网站消息，为深入贯彻落实党的二十届三中全会精神，加大无线电频谱资源对5G产业发展的支持力度，近日，工业和信息化部许可中国移动重耕已用于2G/3G/4G系统的3000MHz以下多个频段频率资源，可同时用于5G公众移动通信系统。

中国新闻网 2024-12-31

跨越5000公里！国际首例远程支气管镜机器人引导肺结节活检术成功实施

近日，国际首例5G辅助下远程柔性支气管镜机器人引导肺结节活检术在广州医科大学第一医院成功实施，实现了跨越5000多公里、“广州-新疆喀什”呼吸内镜的无缝对接。该手术由广州医科大学附属第一医院、广州呼吸健康研究院、国家呼吸医学中心钟南山院士团队的李时悦、钟长镐主任带队携手喀什地区第一人民医院李黎副院长、解承鑫主任团队完成。

南方新闻网 2024-12-31

工信部：加快信息基础设施适度超前发展

据工信微报公众号，12月26日工业和信息化部召开全国信息通信监管工作会，会议强调，2025年是“十四五”规划的收官之年。全行业要以实体经济和数字经济深度融合为主攻方向，加快信息基础设施适度超前发展，推动信息通信技术为实体经济行业赋能赋值赋智，培育壮大融合产业生态。

华尔街见闻 2024-12-31

【机器学习基础】超全汇总！机器学习常用术语词汇表（建议收藏）

算法与模型相关

数据相关

评估指标相关

模型训练与优化相关

推荐体验

相关资讯

【机器学习基础】超全汇总！机器学习常用术语词汇表（建议收藏）

建议收藏-经典《图解机器学习》

AI经典书籍《图解机器学习》建议收藏

值得收藏！机器学习法常用的分析方法

【机器学习】图解10个最常用的机器学习算法

近期资讯

武汉市第三医院：建设智慧医疗体系，让群众享受便捷医疗服务

华为：2024年是原生鸿蒙的关键一年

一加Ace 5 Pro全面评测：最具性价比的骁龙8至尊旗舰游戏水桶机皇！

12月31日译名发布：斯里达拉·帕尼克·索马纳特

到2027年形成一批氢能交通、发电、储能商业化应用模式

千万中国“芯” 京津冀信创集群正飞腾

从即梦的AI文字图片能力，浅谈AI图片工具平台的未来

工信部许可基础电信运营企业开展频率重耕

跨越5000公里！国际首例远程支气管镜机器人引导肺结节活检术成功实施

工信部：加快信息基础设施适度超前发展

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响