虚假的智能？浅谈深度学习的基本原理

作者：马乐乐同学发布时间：2023-07-05

最近一段时间，Chatgpt和AI绘画用强大的性能再一次把人工智能顶上了风口。据统计，开发完成的Chatgpt的OpenAI商业价值实现了翻倍，盈利上百亿美刀。现如今AI公司的高昂市值与深度学习技术的成功密不可分，所有的AI模型（也可以被称为人工神经网络）都依赖于深度学习。为了记录马乐乐过去一段时间的工作，这篇小作文将向读者讲述深度学习的原理，帮助读者更好的认识现代人工智能的本质。

智能生物对于感知到的一切事物都存在着非线性表达的特点，深度学习能够模仿智能生物的原理也正是源于它使AI模型获得了非线性特征表达的能力，从而使得AI模型能够像智能生物一样感知世界。可能有人会说，别的词我都懂，但是“非线性”是什么意思？为什么智能生物一定是非线性表达的？为了回答这个问题，我们首先要了解，与非线性对应的线性是什么意思。这其实是个很容易理解的概念，线性关系就是只存在加法和乘法的意思，它的特点是当输入发生变化时，输出一定会发生相同的变化。比如说，假如一个线性模型对1的感知结果为10，那么它对2的感知结果一定为20，对3的感知结果一定为30，如此容易被看透的模型似乎确实不适合用来模拟智能生物。换个思路来看，用作为智能生物的自己来做验证，我们来辨别一张图片中的动物是猫还是狗，如果是猫的话我们就把它标为1，狗就标为2，下面这张应该是猫吧？

那如果我们将图像的像素值调整为原来的两倍，就变成了下面这张图，线性模型一定会认为输入改为了原来的两倍，输出也应该变为原来的两倍，所以这张图应该是狗，可这张图里的应该不是狗吧...所以说，人类一定是做非线性表达的。

深度学习方法中设计了许多不同作用的层，比如卷积层、激活层、池化层等等，这些层都有着不同的特点和作用，通过像搭积木一样的方式，将不同类型的层组合在一起，形成人工神经网络，这样就可以在计算机上实现非线性特征表达了。一般来说，深度学习模型在搭建好以后，需要经过训练之后才能进行实际使用。训练的过程就像是给小学生教习题一样，我们给定题目，深度学习模型会按照数学公式计算出它认为的结果。之后，我们给它标准答案进行比对，模型会评估自己的结果与标准答案之间的误差，根据误差改变模型内部每个层的数值，从而使下次计算得到的误差减小，这样的过程要经历成千上万次，直到误差小到可以接受的范围内，模型的训练才会停止，从此投入实际应用中。

虽然深度学习使AI模型像人类一样，拥有了非线性特征表达的能力，但是AI模型和真正的智能仍然存在很大的差别，人类智能目前仍是未被研究清楚的秘密，AI模型的智能却完全可以通过大量的计算得到，而这也并不像人类一样，存在着任何思考过程。以前我和别人介绍自己平时在实验室的工作时，总喜欢说“骗人的人工智能”，因为我总觉得，深度学习所制造的AI只有计算，没有思考，更没有情感，在科学家彻底弄清楚人类智能从何而来之前，我们不可能做到电影中那样的人工智能。然而，今年以来人工智能的成就却慢慢的刷新着我的认知，明明人们只是在一味的增加AI模型的大小而已，似乎量变发生了质变，在我的认知里，用于聊天的Chatgpt和用于AI绘画的扩散模型都聪明的太过头了。这成为了马乐乐对自己曾经工作内容最大的疑惑，读者们觉得，靠数学计算实现的人工智能，是虚假的智能吗？