►文观察者网心智观察所
【生成式人工智能正在全球范围内掀起一场划时代的ICT产业革命。算力、算法、数据已成为未来综合国力比拼的必争之地。心智观察所日前连线业界享有盛名的“生成式AI之父”尤尔根·施密德胡贝尔(Jürgen Schmidhuber)。就AIGC发展的内在理路,AGI的可能性以及中国AI产业发展等一系列问题进行了深入对话。】
目前Schmidhuber先生担任瑞士人工智能实验室IDSIA的科学主任以及沙特阿拉伯阿卜杜拉国王科技大学(KAUST)的人工智能计划负责人。
《纽约时报》曾以“当AI成熟时,它或许会称Jürgen Schmidhuber为‘父亲’”为标题对Jürgen Schmidhuber进行过报道。在1990-91年间,他为“生成式AI”奠定了基础,介绍了生成对抗网络(用于深度伪造)的原理、非规范化线性Transformer(ChatGPT中的“T”),以及自监督预训练原理(ChatGPT中的“P”)。他的实验室还开发了 LSTM(长短期记忆),这是 20 世纪引用最多的人工智能技术,以及高速神经网络(Highway Neural Networks),这是第一个非常深的前馈网络(其变体后来成为 21 世纪引用最多的人工智能技术)。埃隆·马斯克曾发推文称:“Schmidhuber发明了所有东西。”Schmidhuber倡导和引领的AI技术已被应用于超过30亿部智能手机上,每天被使用数十亿次。
心智观察所:很高兴有这样一个对话的机会。您发表过对长短期记忆(LSTM)的架构和训练算法,是否可以把LSTM人工神经网络与人脑等生物神经网络进行一个类比?
Schmidhuber:事实上,LSTM 受到了人脑的启发,人脑有大约 1000亿个神经元,每个神经元平均与10000个其他神经元相连。一些是输入神经元,为其余神经元提供数据(声音、视觉、触觉、疼痛、饥饿)。其他则是输出神经元,用于肌肉控制和移动。
大多数神经元隐藏在输入和输出之间,我的思考的出发点就在这里。所有神经元都通过改变连接强度来学习,这决定了神经元相互影响的强度,并且似乎对你一生的所有经验都进行了编码。我们的人工神经网络(比如LSTM)也是如此,它比以前的方法学得更好,可以识别语音、笔迹或视频,最大限度地减少痛苦,最大限度地提高快乐,还能驾驶模拟汽车等。
心智观察所:您提到的LSTM可以“最大限度地减少痛苦,最大限度地提高快乐”,这意味着什么?而这对于实现通用人工智能(AGI)有多重要?
Schmidhuber:这是至关重要的!不过,我应该先解释一下如何对一个学习型的通用人工智能(AGI)进行编程。你其实不需要告诉它具体该做什么事情。相反,你只需要给它一个评价函数(evaluation function),让它去最大化这个函数。
例如,给一个机器人装上疼痛传感器,当它撞到障碍物或感到“饥饿”(由于电池电量过低)时,这个疼痛传感器就会产生负数。而机器人的最终目标是尽可能减少这些负数的总和,因此它必须通过反复试验来找到避免痛苦的方法。直到某一时刻,它就学会在感到饥饿时快速找到充电站,同时避免撞到障碍物。
美剧《西部世界》被编程的“人类”
动物和人类的学习方式本质上也是类似的,都以最大化奖励并避免痛苦来进行学习。而他们的评价函数当然是由生物进化发明或被“编程”的。那些给他们带来进化优势的评价函数得以保留下来。而人工智能的进化至少在仿真模拟中已经存在了几十年了,也以相同的方式正在进行着。
心智观察所:您提到机器人“可能因为电池电量低而感到饥饿。”这让我想到,特斯拉有一个野心勃勃的人形机器人项目,该项目面临的一个瓶颈就是如何优化能耗,比如跳跃和爬楼梯比在地板上行走需要消耗更多能量。您怎么看待这个问题?功耗问题会成为人形机器人的阿喀琉斯之踵吗?相应的解决办法是什么?
Schmidhuber:未来不会只有一种类型的人形机器人,而是会有成千上万种不同类型的机器人,有些很小,这样它们就可以从内部检查和修理小型机器,还有一些则不仅外形高大,力量甚至比现在的一些工业机器人还要强。
有些机器人将会通过连接外部电池的电缆来解决能源问题,另一些则会使用汽油发动机,还有一些在深空中的机器人将使用基于放射性衰变的长效核电池,这类电池在上个世纪的无人航天器中已经使用过了。靠近太阳的,比如在水星上的机器人将大量利用丰富的太阳能。某个时刻,人工智能自己将会发明新的、更高效的电池。事实上,今天的AI已经被用来研发新的有用化学物质、材料、催化剂、药物等。
特斯拉工厂内的机器人
心智观察所:有关AI和药物研发问题,目前您在KAUSTAI中心也在从事这方面的工作。甚至像英伟达和新思科技这样的半导体公司也在使用AI帮助生物制药公司进行药物研发。芯片设计和药物设计之间是否有相似之处?
Schmidhuber:所有人工智能的执行都需要高效的微芯片。然而,芯片设计和药物设计是由不同类型的AI驱动的。药物设计的AI更像是材料科学或化学的AI。这又是如何运作的呢?我们的深度人工神经网络会观察某些特定化学物质在特定温度、压力、催化剂和其他条件下如何相互反应。通过大量的训练样本,它们学会预测最终输出物质的性质,学会直观地理解化学反应的过程。
现在我们可以在逆向模式下使用这些预测机制:假设我们想创造一种以前从未观察到的特定理想特性的新材料,我们需要如何改变输入条件(比如催化剂、材料等)才能获得这种材料?AI化学家会对此提出合理的建议。如果它在现实世界中真的有效的话,那就一切顺利。不然,我们将会用新的训练示例来进一步改进神经网络。
这种方法可以应用到很多地方,例如使用更好的材料可以直接从稀薄的空气中捕获碳,从而减少全球变暖;或者通过更高效的膜技术从海水中提取淡水;可以快速进行药物设计以改善医疗健康。我们的KAUST AI中心正在研究这些课题。
心智观察所:在人工智能机器学习支持的创新药物发现方面,应该如何应对社会伦理的挑战?
Schmidhuber:人工智能科学家提供解决方案,而往往将其伦理规范留给其他人。事实上,有些关于AI监管法规的炒作是愚蠢的。我们无法规范基础人工智能研究,就像我们无法规范数学一样。而在另一方面,我们可以规范人工智能在金融、汽车、医疗保健等领域的应用。不过,这些领域也已经搭建了不断适应各种新情况的监管框架。让我们确保法规不会扼杀开源运动!这就是为什么我签署 LAION 公开信的原因(相关资料可见于https://laion.ai/blog/transparent-ai/)
心智观察所:我们查阅了您签署的LAION的公开信,对“开源是AI安全的黄金标准”和“开源是创新的催化剂”这两个声明印象深刻。但有点惊讶Yann André LeCun也签署了这封信,您之前接受某中国媒体采访时,曾批评他抄袭了您的相关AI学术理念。不过,可能存在一个问题,开源很容易被知识产权破坏者操纵和利用。您认为开源在知识产权保护方面是否有一些弱点?
Schmidhuber:与公域软件不同,开源软件可能附带某些许可条件和限制。我没有看到关于知识产权方面的问题:如果你不想分享你的软件,那就不要让它变成公用的。但如果你选择共享,它可能会变得更受欢迎,而这也可能会带来许多来自下游方的益处,包括商业上利益。
心智观察所:KAUST人工智能中心位于沙特阿拉伯。目前,也有不少中东国家在人工智能方面的创新步伐非常快。您如何评价中东在人工智能创新方面的雄心?此外,据报道,美国因为担心中东成为中国人工智能研发的“后门”从而放缓了对中东的人工智能芯片出口。你的工作有没有受到某些地缘政治因素的影响?
Schmidhuber:沙特公共投资基金(PIF)计划投资400亿美元用于AI。阿联酋也有类似的雄心。中东当地的人口年轻并且乐观地认为AI将可以改善他们的生活。当然,科学和技术不可能完全免受地缘政治的影响,有时甚至受其驱动。
有一个著名的例子:80年前——1944年,二战期间,德国佩内明德(Peenemünde,注:二战期间,它是纳粹德国V1和V2火箭的研发基地)迎来了太空时代,当时沃纳·冯·布劳恩的团队将第一个人造物体送入太空。25年后,1969年,冷战期间,同一支团队(现在在美国工作)将人类送上了月球。当时一切都围绕着火箭科学展开,今天,一切都围绕着人工智能展开。
佩内明德科技博物馆内的航天器展览
无可置疑的是,我们也意识到主要大国之间地缘政治的紧张局势,但我一直在强调,我们在KAUST由沙特资助的开源人工智能研究是惠及全人类的,而不仅仅是某些特定的公司或国家。
心智观察所:中国的生成式AI产业仍处于早期发展阶段,但成长迅速,并且中国推出了越来越多的大语言模型。您认为中国应该怎么做才能缩小与美国在AI加速器(用于训练和AI推理的GPU)方面的差距?
Schmidhuber:我认为中国已经在大力投资建设自己的自主可控的AI硬件,试图模仿目前只有荷兰的ASML能够做到的事情,因为美国政府在阻止ASML向中国交付其最新的芯片制造所需要的光刻机。
总体而言,历史证明,一个主要大国在技术上追赶另一个大国可能只需要几年时间。例如,德国在1938年发现了核裂变(原子弹的原理),仅仅7年后,美国就拥有了可用的核武器。而再过4年,苏联也有了核武器。到如今,许多国家都拥有核武器。值得注意的是,中国目前在人工智能领域发表的论文和获得的专利数量超过了其他任何国家。如果中国在未来几年内没有缩小硬件差距,我会对此感到十分惊讶。
来源|心智观察所