OpenAI 内部力推，AI 代理真能成为互联网应用发展的下一个阶段吗？

作者：巴比特资讯发布时间：2023-07-04

图片来源：由无界 AI 生成

互联网应用的发展历史可以被看作是一个不断演化和创新的过程，随着技术的不断进步，不断有创新的互联网应用的出现。

互联网应用的发展主要可以划分为三个阶段：

1.网站应用（Websites）

1990年代，随着互联网的普及，出现了一些重要的互联网公司，如亚马逊、雅虎、谷歌等，这些公司开发出了一些重要的互联网应用，如电子商务、搜索引擎、在线广告等。

2.移动应用（Mobile）

2000年代，随着移动互联网的兴起，出现了一些重要的移动应用，如智能手机、移动应用商店等。

3.AI代理应用

2020年代，随着 AI 技术的发展，出现了一些重要的人工智能应用，如语音识别、图像识别、自然语言处理等。尤其是 OpenAI 推出 ChatGPT 之后，由大语言模型（LLM）推动的自主 AI 代理应用将会使 AI 代理应用走向新的发展阶段。

AI代理发展版图

图片来源：e2b

什么是 AI 代理

AI代理（AI agent）是指使用 AI 技术设计和编程的一种计算机程序，其可以独立地进行某些任务并对环境做出反应。AI代理可以被视为一个智能体，它能够感知其环境，通过自己的决策和行动来改变环境，并通过学习和适应来提高其性能。这种智能体同时使用短期记忆（上下文学习）和长期记忆（从外部向量存储中检索信息），有能力通过逐步“思考”来计划、将目标分解为更小的任务，并反思自己的表现。

AI代理通常包含多种技术，如机器学习、自然语言处理、计算机视觉、规划和推理等，这些技术使代理能够自主地处理信息并作出决策。

OpenAI已经多次表达了对 AI 代理的热衷。OpenAI 联合创始人 Andrej Karpathy 近日在一场开发者线下活动中表示，如果一篇论文提出了某种不同的模型训练方法，OpenAI 内部都会嗤之以鼻，认为都是他们玩剩下的。但是当新的 AI Agents论文出来的时候，他们会认真兴奋的讨论。

什么是 LLM 支持的自主代理

OpenAI AI应用研究主管 Lilian Weng 最近发布了一篇关于 AI 代理的万字长文：《大语言模型（LLM）支持的自主代理》，深度解读了什么是由 LLM 训练构建的 AI 代理应用。LLM 支持的 AI 代理现在已经出现了很多优秀的应用，例如 AutoGPT、GPT-Engineer、BabyAGI 和 SuperAGI 等。

在LLM 支持的自主代理系统中，LLM 充当代理的大脑，并由几个关键组件进行补充：规划（Planning）、内存（Memory）、工具使用（Tool Use)。

这种代理会将大型任务分解为更小的、可管理的子目标，从而能够有效处理复杂的任务。它还可以对过去的行为进行自我批评和自我反思，从错误中吸取教训，并针对未来的步骤进行完善，从而提高最终结果的质量。

LLM自主代理的一个特别之处在于它就像是拥有“记忆”一样，它能够短期（长期）记住在训练中学习到的东西。此外，LLM 自主带来能够学习调用外部 API 来获取模型权重中缺失的额外信息（通常在预训练后很难更改），包括当前信息、代码执行能力、对专有信息源的访问等。

尽管AI 代理令人兴奋且充满希望，但围绕人工智能代理的炒作仍然存在很多挑战。 AI 代理正在成为软件应用的未来方向，将会变得越来越普遍。

正如Lilian Weng 所说，LLM 自主代理还存在一些常见的限制，包括上下文长度有限、长期规划和任务分解的挑战、LLM 的稳定性等等。

但无需质疑的是，这些问题和挑战都将会被克服或缓解，AI代理已经对我们的工作和生活带来了改变，这种改变是难以被逆转的。尝试过好的东西之后，你还会忍受极差的吗？

参考资料：