探索机器学习的这一分支,该分支在大量数据上进行训练,并处理协同工作以执行预测的计算单元
在萌芽时期,人工智能 (AI) 主要关注基于规则的系统,这些系统将使用必须由主题专家提供的预定义规则集进行预测。然而,这些系统很脆弱,依赖于这些“专家意见”,最终导致它们过时。随着数据规模和数量的增加,这些方法被一种更加数据驱动的方法所取代,即机器学习。
机器学习是算法和工具的集合,可帮助机器理解数据中的模式,并使用这种底层结构对给定任务进行推理。机器可以通过多种方式来理解这些基本模式。但是机器学习与有什么关系呢?在本文中,我们概述了深度学习如何适应这一领域,并讨论了它的一些应用和挑战。
人们越来越误解深度学习是机器学习领域的竞争技术。在本文中,我们将讨论其中的一些误区,并解释深度学习与机器学习的关系,以及在某些应用中使用深度学习算法的优势。
从长远来看,深度学习是机器学习的一个子领域。凭借加速的计算能力和大型数据集,深度学习算法能够自我学习数据中的隐藏模式以进行预测。
从本质上讲,您可以将深度学习视为机器学习的一个分支,它基于大量数据进行训练,并处理许多协同工作以执行预测的计算单元。
为了创建学习方式类似于人类学习方式的系统,深度学习的底层架构受到人脑结构的启发。出于这个原因,深度学习中的许多基本术语可以映射到神经学。与神经元如何形成大脑的基本构建块类似,深度学习架构包含一个计算单元,允许对称为感知器的非线性函数进行建模。
深度学习的魔力始于不起眼的感知器。类似于人脑中的“神经元”如何在整个神经系统中传递电脉冲,感知器接收一系列输入信号并将其转换为输出信号。
感知器旨在通过将许多层堆叠在一起来理解数据表示,其中每一层负责理解输入的某些部分。可以将层视为计算单元的集合,这些计算单元学习检测值的重复出现。
每一层感知器都负责解释数据中的特定模式。这些感知器的网络模仿大脑中的神经元如何形成网络,因此该架构称为神经网络(或人工神经网络)。
本节概述了深度学习、人工神经网络 (ANN) 背后的架构,并讨论了一些关键术语。
如下图所示,每个感知器由以下几部分组成:
输入 x1 到 xn,也可以用向量 X 表示。 X i 表示数据集中的第i 个条目。数据集中的每个条目都包含 n 个因变量。
权重 w1 到 wn,可以表示为矩阵 W
偏置项 b,它是一个常数
步骤 1 的输出现在通过激活函数传递。激活函数 g 是一个数学函数,可用于在将输出发送到下一层之前将输出转换为所需的非线性格式。它将求和结果映射到所需的范围。这有助于确定神经元是否需要被激活。
例如,sigmoid 函数将值映射到范围 [0,1],如果您希望系统预测概率,这将非常有用。这样可以对复杂的非线性决策边界进行建模。
在上一节中,您看到了每个感知器中发生的计算。现在,您将看到这些感知器如何适应网络以及如何完成流程。
在最基本的形式中,神经网络包含三层:输入层、隐藏层和输出层。如下图所示,只有一个隐藏层的网络称为浅层神经网络。