文|陈根
虽然过去人们对通用人工智能(AGI)总有各种抽象的想法,但如今,随着图像生成、代码生成、自然语言处理等AI生成技术的发展,通用人工智能似乎已经走到了一个重要的十字路口。生成式AI是技术底座之上的场景革新,涵盖了图文创作、代码生成、游戏、广告、艺术平面设计等应用。
可以看到的是,以多模态预训练大模型、生成式AI为代表的AI技术已经来到规模化前夜、爆发前的奇点。一方面,人类对AGI的想象开始具象;另一方面,对AGI前途无量感到震惊的科学家们,则开始着手探讨并如何塑造 AGI 的未来。
从狭义AI到通用AI
到目前为止,我们所接触的AI产品大都还是狭义AI。
简单来说,狭义AI就是一种被编程来执行单一任务的人工智能——无论是检查天气、下棋,还是分析原始数据以撰写新闻报道。狭义AI系统可以实时处理任务,但它们从特定的数据集中提取信息。因此,这些系统不会在它们设计要执行的单个任务之外执行。
Google assistant、Google Translate、Siri等自然语言处理工具都是狭义AI的产品。虽然它们能够与我们交互并处理人类语言,但这些机器远没有达到人类的智能水平。比如,当我们与Siri交谈时,Siri并不能灵活地来响应我们的查询。相反,Siri所能做的,就是处理人类语言,将其输入搜索引擎,然后返回给我们。
通用AI则是指在不特别编码知识与应用区域的情况下,应对多种甚至泛化问题的人工智能技术。虽然从直觉上看,狭义AI与通用AI是同一类东西,只是一种不太成熟和复杂的实现,但事实并非如此。
狭义AI就像是计算机发展的初期,人们最早设计电子计算机是为了代替人类计算者完成特定的任务。而艾伦·图灵等数学家则认为,我们应该制造通用计算机,我们可以对其编程,从而完成所有任务。
于是,曾经在一段过渡时期,人们制造了各种各样的计算机,包括为特定任务设计的计算机、模拟计算机、只能通过改变线路来改变用途的计算机,还有一些使用十进制而非二进制工作的计算机。现在,几乎所有的计算机都满足图灵设想的通用形式,我们称其为“通用图灵机”。只要使用正确的软件,现在的计算机几乎可以执行任何任务。
市场的力量决定了通用计算机才是正确的发展方向。如今,即便使用定制化的解决方案,如专用芯片,可以更快、更节能地完成特定任务,但更多时候,人们还是更喜欢使用低成本、便捷的通用计算机。现在,AI也将出现类似的转变——通用AI将成为主流,它们与人类更类似,能够对几乎所有东西进行学习。
当然,通用AI并非全知全能。与任何其他智能存在一样,根据它所要解决的问题,它需要学习不同的知识内容。比如,负责寻找致癌基因的AI算法不需要识别面部的能力;而当同一个算法被要求在一大群人中找出十几张脸时,它就不需要了解任何有关基因互作的知识。通用人工智能的实现仅仅意味着单个算法可以做多件事情,而并不意味着它可以同时做所有的事情。
值得一提的是,通用AI又与强人工智能不同。强人工智能(strong artificial intelligence)是约翰·希尔勒在提出“中文屋实验”时设定的人工智能级别。这个等级的人工智能,不仅要具备人类的某些能力,还要有知觉,有自我意识,可以独立思考并解决问题。虽然两个概念似乎都对应着人工智能解决问题的能力,但通用AI更像是无所不能的计算机,而强人工智能则超越了技术的属性成为类似穿着钢铁侠战甲的人类。
如何实现通用人工智能?
自人工智能诞生以来,科学家们就在努力实现通用AI,实现通用AI具体可以分为两个路径。
第一条路就是让计算机在某些具体任务上超过人类,如下围棋、检测医学图像中的癌细胞。如果能够让计算机在执行一些困难任务时的表现超过人类,那么最终就会发现如何让计算机在所有任务中都比人类强。通过这种方式来实现通用AI,AI系统的工作原理以及计算机是否灵活就无关紧要了。
唯一重要的是,这样的人工智能计算机在执行特定任务时比其他人工智能计算机更强,并最终超越最强的人类。如果最强的计算机围棋棋手在世界上仅仅位列第二名,那么它也不会登上媒体头条,它甚至可能会被视为失败者。但是,击败世界上顶尖的人类棋手就会被视为一个重要的进步。
第二条路,是重点关注AI的灵活性。通过这种方式,人工智能就不必具备比人类更强的性能。科学家的目标就变成了创造可以做各种事情并且可以将从某个任务中学到的东西应用于另一个任务的机器。
比如,当前发展如火如荼的AI 生成就遵循了这样的路径。过去一年,有关AI生成技术上的进展主要包括三个方面。一个是图像生成,即以DALL-E 2、Stable Diffusion为代表的扩散模型;一个是NLP(自然语言处理),即基于GPT-3.5的ChatGPT;还有一个就是代码生成,比如基于CodeX的Copilot。
以近日大火的ChatGPT为例,这款当今最火爆的AI语言模型,由美国人工智能实验室OpenAI于去年11月底发布,并迅速火遍全球。不同于过去那些智能语音助手的傻瓜回答,这次ChatGPT却出乎意料的聪明:它可以用来创作故事、撰写新闻、回答客观问题、聊天、写代码和查找代码问题等。外媒评论甚至称,ChatGPT会成为科技行业的下一个颠覆者。
事实也确实如此,基于庞大的数据集,ChatGPT得以拥有更好的语言理解能力,这意味着它可以更像一个通用的任务助理,能够和不同行业结合,衍生出很多应用的场景。可以说,ChatGPT已经为通用AI打开了一扇大门。
并且,ChatGPT引入了人类监督员,专门“教”AI如何更好地回答人类问题。AI的回答符合人类评价标准时,就给AI打高分,否则就给AI打低分。这使得AI能够按照人类价值观优化数据和参数。也就是说,互联网中,只要涉及文本生成和对话的,都能够被ChatGPT“洗一遍”,这使得ChatGPT能得到一个接近于自然人类语言对话的效果。
以自动驾驶为例,目前的自动驾驶与人的交互还是比较机械的,比如前面有一辆车,按照规则,它有可能会无法正确判断什么时候该绕行。而ChatGPT等人工智能的迭代,未来可能会让机器更接近人的思维模式,学习人的驾驶行为,带领自动驾驶进入“2.0时代”。
另外,“ChatGPT+”更是打开了想象力大门。有用户把 ChatGPT + Stable Diffusion(AI文生图工具) 结合使用。即先要求 ChatGPT 生成随机的艺术 prompt,然后把 prompt 作为 Stable Diffusion 的输入,生成一副艺术性很强的画作。还有人提出“ChatGPT+WebGPT”, WebGPT为高阶版网页爬虫,从互联网上摘取信息来回答问题,并提供相应出处。“ChatGPT+WebGPT”产生的结果信息可以实时更新,对于事实真假的判断更为准确。
针对ChatGPT在解答数学题方面的拉垮表现,计算机科学家、Wolfram 语言之父 Stephen Wolfram 发文表示,正在将ChatGPT与自己的 Wolfram | Alpha 知识引擎结合起来用,因为后者具有强大的结构化计算能力,可以实现完美互补。“ChatGPT+”效应的出现,似乎更进一步推动了通用AI走向我们。
接下去的路应该怎么走?
虽然AI生成的快速发展让人们看到了通用AI的希望,但实际上,当前的AI生成依然不是根本性的突破。
今天的AI生成之所以能如此灵活,就在于其庞大的训练数据集。也就是说,如果没有根本性的新创新,通用AI就可能会从更大规模的模型中产生。ChatGPT就是将海量的数据结合表达能力很强的Transformer模型结合,从而对自然语言进行了一个非常深度的建模。尽管ChatGPT的相关数据并未被公开,但它的上一代GPT-3的整个神经网络就已经有1750亿个参数了。
虽然越来越大的模型确实让通用AI性能很强,比如图像生成等任务都需要借助大模型,但庞大的模型也带来了一些问题。
首先,世界上可能没有足够的数据量来支持规模最大化。来自纽约大学和苏黎世联邦理工大学的研究人员William Merrill、Alex Warstadt和Tal Linzen最近提出了一个证明,称“目前的神经语言模型不太适合在没有大量数据的情况下提取自然语言的语义”。尽管这个证明中包含了太多的前置假设,但是如果这个假设接近正确的话,那么在规模上可能很快就会出现麻烦。
其次,世界上可能没有足够的可用计算资源支撑规模最大化。要知道,计算从来都是一件费电的事情。Miguel Solano认为,要想达到当前的超级基准,例如BIG-bench,将会需要消耗2022年全美国电力消耗的四分之一还多。而BIG-bench还只是一个众包的基准数据集,旨在探索大型语言模型并推断其未来的能力,其中包含200多个任务。
以AI生成为代表的通用AI除了面对发展中技术的问题,还需要回应伦理的挑战。随着自动化的发展,人工智能将接管更多工作,人们的担忧是,人与机器地位的转换可能会在我们毫无防备的情况下突然发生。实际上,我们已经走在将人类工作让渡给人工智能的道路上了,而我们需要解决的问题是:在一个处处受到人工智能协助的世界中,我们接下去的路应该怎么走?
显然,为了让人类的受益最大化,并促进自由、平等、透明和财富的分享,我们需要决定如何有效运用基于人工智能的各种技术。
一方面,我们不得不重视AI技术进步给社会带来的影响。ChatGPT、AlphaFold等工具出来后,人们发现,最先感受到AI冲击的反而是创造性的工作,而这些涉及创造力、知识探索的行业,又是人文领域的核心,是人类最担心被机器化的部分。一直以来,AI在这些领域的重大突破都伴随着广泛的伦理争议。
世界复杂性科学研究中心、美国圣塔菲研究所教授梅勒妮·米切尔近日在接受媒体采访时就谈到,过于盲目采用这些技术,将我们的交流和创意自动化,可能会导致人类失去对机器的控制,“机器人会给机器人写电子邮件,而机器人会回复其他机器人”。米切尔说,“我们作为人的特质从我们的信息中被卷走了。”
另一方面,过分强调人工智能对人类生存的威胁,会把人们的注意力从那些更紧迫的问题上分散出去,也可能会助长那些反对能造福社会技术的声音、扼杀技术创新。实际上,AI的“思考模式”与人类的思考模式完全不同。20年后,基于深度学习的机器及其“后代”也许会在很多任务上击败人类,但在很多任务上,人类会比机器更擅长。
基于此,在未来,更可能出现的情况,或许是我们人类与寻求人类与AI的良性共生,而不是纠结于基于深度学习的AI能否成为或者何时成为通用人工智能的问题。通用AI的出现,或许也向人们展示了这样一个道理——不只有人类才是智能的黄金标杆。