最近一段时间,Chatgpt和AI绘画用强大的性能再一次把人工智能顶上了风口。据统计,开发完成的Chatgpt的OpenAI商业价值实现了翻倍,盈利上百亿美刀。现如今AI公司的高昂市值与深度学习技术的成功密不可分,所有的AI模型(也可以被称为人工神经网络)都依赖于深度学习。为了记录马乐乐过去一段时间的工作,这篇小作文将向读者讲述深度学习的原理,帮助读者更好的认识现代人工智能的本质。
智能生物对于感知到的一切事物都存在着非线性表达的特点,深度学习能够模仿智能生物的原理也正是源于它使AI模型获得了非线性特征表达的能力,从而使得AI模型能够像智能生物一样感知世界。可能有人会说,别的词我都懂,但是“非线性”是什么意思?为什么智能生物一定是非线性表达的?为了回答这个问题,我们首先要了解,与非线性对应的线性是什么意思。这其实是个很容易理解的概念,线性关系就是只存在加法和乘法的意思,它的特点是当输入发生变化时,输出一定会发生相同的变化。比如说,假如一个线性模型对1的感知结果为10,那么它对2的感知结果一定为20,对3的感知结果一定为30,如此容易被看透的模型似乎确实不适合用来模拟智能生物。换个思路来看,用作为智能生物的自己来做验证,我们来辨别一张图片中的动物是猫还是狗,如果是猫的话我们就把它标为1,狗就标为2,下面这张应该是猫吧?
那如果我们将图像的像素值调整为原来的两倍,就变成了下面这张图,线性模型一定会认为输入改为了原来的两倍,输出也应该变为原来的两倍,所以这张图应该是狗,可这张图里的应该不是狗吧...所以说,人类一定是做非线性表达的。
深度学习方法中设计了许多不同作用的层,比如卷积层、激活层、池化层等等,这些层都有着不同的特点和作用,通过像搭积木一样的方式,将不同类型的层组合在一起,形成人工神经网络,这样就可以在计算机上实现非线性特征表达了。一般来说,深度学习模型在搭建好以后,需要经过训练之后才能进行实际使用。训练的过程就像是给小学生教习题一样,我们给定题目,深度学习模型会按照数学公式计算出它认为的结果。之后,我们给它标准答案进行比对,模型会评估自己的结果与标准答案之间的误差,根据误差改变模型内部每个层的数值,从而使下次计算得到的误差减小,这样的过程要经历成千上万次,直到误差小到可以接受的范围内,模型的训练才会停止,从此投入实际应用中。
虽然深度学习使AI模型像人类一样,拥有了非线性特征表达的能力,但是AI模型和真正的智能仍然存在很大的差别,人类智能目前仍是未被研究清楚的秘密,AI模型的智能却完全可以通过大量的计算得到,而这也并不像人类一样,存在着任何思考过程。以前我和别人介绍自己平时在实验室的工作时,总喜欢说“骗人的人工智能”,因为我总觉得,深度学习所制造的AI只有计算,没有思考,更没有情感,在科学家彻底弄清楚人类智能从何而来之前,我们不可能做到电影中那样的人工智能。然而,今年以来人工智能的成就却慢慢的刷新着我的认知,明明人们只是在一味的增加AI模型的大小而已,似乎量变发生了质变,在我的认知里,用于聊天的Chatgpt和用于AI绘画的扩散模型都聪明的太过头了。这成为了马乐乐对自己曾经工作内容最大的疑惑,读者们觉得,靠数学计算实现的人工智能,是虚假的智能吗?