“AI代理会阅读你没有时间阅读的内容。这非常重要,因为人类将永远不会再访问搜索网站,也永远不会再去亚马逊了,一切都将通过你的代理人来解决。”微软联合创始人比尔·盖茨近日表示。
盖茨还认为,一旦这样的AI数字代理问世,可能对谷歌、亚马逊和其他大公司构成潜在威胁。
在人工智能语音助理苹果Siri和亚马逊Alexa横空出世大约十年后,AI大模型ChatGPT等带火了具有更大自主权的新一波人工智能助手AI数字代理(AI agent),并吸引大量资本押注。
AI数字代理是指能够在人类的指导下执行更复杂的任务,而无需密切监督的人工智能助理,有时也被称为AI“副驾”。硅谷科技公司正在竞相利用人工智能技术的进步,在ChatGPT等大模型上运行AI数字代理的实验系统。投资人已经为此注入数十亿美元的资本。
人类可能永远不需要上网了
包括盖茨以及Meta首席科学家杨立昆在内的技术领导者都相信,未来每个人都会拥有一个私人AI助理,从而为自己提供从生活到工作全方位的服务。
它就像是影片《钢铁侠》中的“贾维斯”,帮助托尼·斯塔克执行他希望执行的任务。
盖茨近期在高盛的一场人工智能前沿会议上预测,一定会有一家公司最终能够创建出一个AI数字代理,它将了解每个人的所有活动并为他/她执行某些任务。
OpenAI的最大投资者微软是瞄准AI数字代理领域的巨头之一。微软CEO萨蒂亚·纳德拉(Satya Nadella)认为,基础模型技术的发展是AI助理从微软Cortana、亚马逊Alexa、苹果Siri以及Google Assistant等演进的一次飞跃。在他看来,过去的这些数字助理都没有达到最初的预期。
“他们全都傻得像石头一样,无论是Cortana、Alexa、Google Assistant还是Siri,所有这些都没有用了。”纳德拉今年早些时候表示。
亚马逊发言人表示,团队正在开发新模型,以使Alexa助手更加强大和有用。
AI数字代理雏形已问世
目前硅谷的科技巨头和初创公司都在争相开发这样的AI数字代理,尽管这距离模仿科幻小说中的片段还很遥远,但已经有一些AI数字代理的雏形问世了。
AI数字代理本质上是使用AI技术设计和编程的一种计算机程序,可以独立地进行某些任务并对环境做出反应。AI代理可以被视为一个智能体,它能够感知环境,通过自己的决策和行动来改变环境,并通过学习和适应来提高性能。
一般来说,AI数字代理有能力通过逐步“思考”来计划,并将目标分解为更小的任务,反思自己的表现。它通常包含多种技术,如机器学习、自然语言处理、计算机视觉、规划和推理等,这些技术使代理能够自主地处理信息并作出决策。
谷歌旗下AI团队DeepMind上个月推出了一个能够自主发现更快排序算法的强化学习代理AlphaDev。AlphaDev先进的计算机科学算法,超越了工程师和科学家数十年来的人类基准。
DeepMind还发布了一个能够自我改进的AI数字代理RoboCat,它是由AI赋能的软件程序,相当于机器人的“大脑”,并具有一定的“通用性”,可实现自我改进、自我提升。
DeepMind研究人员称,RoboCat的学习速度比目前其他最先进的模型要快得多。这种能力将有助于加速机器人研究,因为这减少了对人类监督训练的需求,并且是创建通用机器人的重要一步。
研究人员首先通过展示人类控制的机械臂如何执行任务来训练RoboCat,例如捡起水果块。然后,RoboCat可以自行训练,在没有监督的情况下可平均执行1万次任务。
早在去年,DeepMind就已经在《自然·通讯》杂志上发表了一篇研究论文,称AI数字代理将会谈判并能达成协议,通过深度强化学习方法建模的“AI代理”可与其他人工代理沟通合作,比如在玩游戏时共同制定计划。
OpenAI也已经多次表达了对AI代理的热衷。OpenAI联合创始人安德烈·卡帕斯(Andrej Karpathy)近日在一场开发者线下活动中表示,如果一篇论文提出了某种不同的模型训练方法,OpenAI内部都会嗤之以鼻,认为都是他们玩剩下的;但如果有新的关于AI代理的论文发表时,他们会认真兴奋地进行讨论。
第一代产品可能来自初创公司
尽管巨头蜂拥开发AI数字代理,但业内认为,最初为消费者提供AI数字代理的可能是初创公司。一些AI初创公司也正在进行AI代理的测试开发。
例如由科技行业领袖里德·霍夫曼(Reid Hoffman)和穆斯塔法·苏莱曼(Mustafa Suleyman)创建的一家名为Inflection AI的公司,上个月底筹集了13亿美元资金。该公司正在开发一款私人AI助理,据称可以充当顾问或处理诸如在旅行延误后获得航班积分和订酒店等任务。
另一家AI初创公司Adept近期也筹集了超过4亿美元资金,该公司的产品ACT-1是一个大型语言模型,它能直接与浏览器和商业软件交互,自动完成复杂操作。例如在客户关系管理(CRM) 软件Salesforce上,它将原本需要进行十几次点击和输入的操作,在用户输入指令后,即可一次性自动完成。
AI初创公司General intelligent CEO邱侃军表示,许多对人来说很容易的事情对计算机来说仍然非常困难。他认为,真正的挑战是构建具有强大推理能力的AI系统。
能够进行相对复杂推理的AI系统的早期演示来自于今年早些时候创建的BabyAGI和AutoGPT等开源项目。这种代表人工智能“新前沿”的技术能够教导类似GPT这样的模型完全自主地执行复杂的项目。
对于普通人而言,AI数字代理未来可以做的事情有很多,包括自己浏览网站并为主人订购汉堡,它还可以制定投资、销售策略,发送电子邮件以及进行会议总结。
AGI曙光初现,该担忧风险吗?
人工智能初创公司Perplexity AI CEO阿拉文德·斯里尼瓦斯(Aravind Srinivas)警告称,AutoGPT这类模型可能会有很多出错的方式,他认为应该提供受人类监督的“AI代理”产品。“你必须像对待婴儿一样对待人工智能,并像妈妈一样不断监督它。”斯里尼瓦斯表示。
许多关注人工智能伦理的计算机科学家指出,人类偏见的持续存在和潜在的错误信息可能会带来近期的危害。虽然有些人看到了未来的“贾维斯”,但另一些人则担心《2001:太空漫游》中凶残的HAL 9000。
有“人工智能教父”之称的计算机科学家本吉奥(Yoshua Bengio)敦促人们谨慎行事。他担心该技术未来的先进迭代可能会创造并实现自己意想不到的目标。
特斯拉CEO马斯克也对人工智能的伦理问题高度关注。上周,马斯克建立了他的首个人工智能公司xAI,其目标就是创建一个“不太会消灭人类”的AI大模型。
人工智能对消费者的潜在影响已经引起多国监管部门的重视。上周,美国联邦贸易委员会(FTC)开始调查OpenAI可能对消费者造成的影响,尽管FTC没有直接提及AI数字代理,但OpenAI已经表示,对于将自己的开放式AI代理推向市场持谨慎态度。
微软也表示,其愿景是实现人类能够控制的人工智能AI代理或者“副驾”,而不是AI“自动驾驶”。