国内近 50 款 AI Agent 产品问世，技术足够支撑应用可靠性了吗？

作者：InfoQ发布时间：2024-09-24

作者 | InfoQ 研究中心

在 2024 年 5 月发布的《中国 AGI 市场发展研究报告》中，InfoQ 研究中心将 AI Agent 定义为连接模型层与应用层的中间层，是现阶段大模型落地应用的重要补充。那在过去的两个季度，AI Agent 领域发生了诸多变化，本文希望通过分析技术框架、理想与现实的差距，以及厂商背景，为大家提供对 AI Agent 现状的全面理解。

AI Agent 技术框架趋于统一

自 2023 年 3 月起，以 AutoGPT 为代表的一系列技术框架发布后，AI Agent 凭借其自主性和问题解决能力，迅速成为科技圈讨论的焦点。在随后的时间里，技术领域陆续推出了多种 AI Agent 技术框架，涵盖通用、环境模拟、软件开发、多模态、翻译、终端交互、数据分析等多种类型。同时，关于单智能体与多智能体的讨论也在持续。

在技术框架的不断探索中，AI Agent 的技术框架认知逐渐统一。大模型作为智能体的大脑，指导规划、工具使用、记忆三大基本能力模块具体行动。并在具体行动过程中，通过与环境、其他智能体以及人类的交互反馈，促进智能体的不断进化。

大模型「大脑」足够聪明到支撑 AI Agent 落地了吗？

从技术框架的角度，我们可以看到大模型在智能体中的重要性，这也引发了一个关键问题：大模型「大脑」是否足够聪明以支持 AI Agent 的实际落地？

作为智能体的大脑，大模型在短短两年内经历了三次主要更新和竞争重点的转变。然而，针对工具调用或真实环境模拟的国内外测试结果显示，当前大模型的表现仍不尽如人意。例如在 WebArena 测试中，GPT-4 的成功率也仅有 14.9%，今年发布的 GPT-4o 也并没有获得明显提升。

注：WebArena 通过构建一个智能体命令和控制环境，通过对大模型在电子商务、社交论坛、软件开发协作和内容管理四类环境中一系列评估任务的功能正确率进行评估。网址：https://webarena.dev/。

此外，在 T-Eval 基准测试中，各大模型在推理得分方面普遍偏低且模型间差距明显。

注：T-Eval 大模型智能体基准测试，是专门针对智能体工具使用的全过程设计的基准测试，包含：规划（Plan）、推理（REASON）、检索（RETRIEVE）、理解（UNDERSTAND）、指令跟随（INSTRUCT）和审查（REVIEW）

在本次报告的访谈中，来自一线的专家也提及，当前大模型在任务拆解和规划能力方面仍存在明显不足。现阶段，依赖大模型进行独立思考和自主规划路径的方式，尚不足以确保智能体的可靠性和任务成功率。

理想中的智能体和现阶段有哪些差距？

除了规划能力与理想状态存在一定差距外，InfoQ 研究中心还从自主思考、工具调用、记忆和多模态理解等方面，深入分析了理想中的智能体与现阶段智能体之间的差距。这样的技术现状也对 AI Agent 的开发与应用提出了更高的要求，迫使技术团队不断优化系统的可靠性，以实现更加全面的任务执行能力。

目前中国市场中，有哪些 AI Agent 产品已经面世？

InfoQ 研究中心还发现，目前在各个领域，已有众多不同类型的 AI Agent 产品面世，并且不同的产品从例如工作流等不同的方面提供了技术解决方案。因此 InfoQ 研究中心也从平台类和垂直类的角度出发，盘点了近 50 个中国市场中的 AI Agent 产品，并形成《中国 AI Agent 产品罗盘》。

《罗盘》仍将持续更新，欢迎各位开发者和读者朋友们积极反馈和持续关注，也欢迎各类厂商参与交流，与 InfoQ 研究中心分享技术和产品的最新动态（联系方式：InfoQ 研究中心首席分析师姜昕蔚：18618257676）。

参与 AI Agent 市场竞争的厂商背景如何？

除了产品盘点外，InfoQ 研究中心在对市面上对外提供 AI Agent 服务的厂商进行研究，并发现其背景主要分为大模型创业厂商、互联网科技厂商、RPA/ 流程自动化厂商和数字化企业服务商。

大模型创业厂商：以 Dify、澜码科技、面壁智能为代表，借助自身大模型技术基础，满足企业大模型技术实际应用的需求。其主要竞争优势在于对大模型具有技术前瞻视角。其主要通过提供 AI Agent 应用市场 & 开发平台，为用户提供构建 AI agent 的便捷服务。
互联网科技厂商：以百度、火山引擎、腾讯为代表，借助借助自身大模型以及 AI 云服务，为客户提供完整的 AI 技术解决方案。因其自身基础设施、云、大模型等 AI 生态建设完整。同时先前多推出了大模型相关的应用，建立了较为良好的用户基础和产品迭代模式。其主要也通过提供 AI Agent 应用市场 & 开发平台，为用户提供构建 AI agent 的便捷服务。
RPA/ 流程自动化厂商：以来也科技、实在智能为代表，其主要将 AI Agent 技术思路集成进原有 RPA 产品中，依托自身长期积累的企业内流程自动化落地经验，为客户提供更智能化的 AI+RPA 类产品和服务。
数字化企业服务商：以用友、金蝶、标普云、数势科技为代表，依托自身长期积累的垂类领域或行业的 Know-how，实现企业内数字化系统的功能升级。对于此类厂商而言，AI Agent 多作为一个功能组件，内置进数字化系统，通过完善的 API 联动生态，实现与原有数字化系统的深度集成，从而让用户无感地体验 AI Agent。

国内近 50 款 AI Agent 产品问世，技术足够支撑应用可靠性了吗？

推荐体验

相关资讯

国内近 50 款 AI Agent 产品问世，技术足够支撑应用可靠性了吗？

江苏百瑞赢解析解释技术在金融领域的应用可靠性与可行性评估

AI大模型测评报告：数据隐私、技术可靠性为用户最大顾虑

技术咨询公司Thoughtworks与AI Singapore合作研究人工智能可靠性

AI大模型：软件可靠性工程发展新思路

近期资讯

选购电视机的八大关键要素，助你找到理想选择

选择合适字体提升文字表达效果的技巧与建议总结

生活中的计算：从简单到复杂的技巧与方法探讨

无线网络常见问题及解决方法分享，让你的上网体验更顺畅

初学者必读：如何打开浏览器及实用技巧详解

探索手势设置：提升设备操作便利性与个性化体验的方法指南

秒表使用指南：掌握时间管理的利器与技巧

轻松掌握开麦克风技巧，提升沟通能力与表达自信的指南

有效拦截骚扰电话的实用技巧与防范措施

简化系统升级步骤，提升设备性能与安全性的重要指南

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响