---
近年来,大模型的能力边界不断拓展,为基于大模型的新应用、新服务、新业态夯实了坚实的技术基础。
智能体(AI Agent)作为重要应用模式,可以将大模型能力转化为实际问题的解决能力,是打通业务场景和人类交互的桥梁。截至目前,国内外在智能体赛道已相继取得许多进展。
国际上,美国加州大学伯克利分校今年提出了BFCL测试排行榜,从多个维度评估模型的函数调用能力,包括Single Turn和Multi Turn、Non-Live和Live、AST总结和Exec总结、幻觉评估、模型成本和延迟等。
OpenAI近期接连发布了两项与AI智能体(Agent)有关的研究成果,分别是智能体的测试基准MLE-Bench和多智能体协调框架Swarm。
NEWS
而早在2023年中国信通院便已启动智能体标准编制工作,今年4月底正式发布《智能体技术要求与评估方法》系列标准。
聚焦智能体平台与工具、技术能力和应用服务等方面,形成了智能体应用成熟度评价方法,便于应用方评估和选取适配产品,为智能体技术发展和行业应用提供参考。
智能体技术架构与演进趋势
定义与范畴
AI Agent是以大语言模型为大脑驱动,可以自主理解、感知、规划、记忆和使用工具的能力,能够自动化执行完成复杂任务的智能系统。不同于传统的人工智能,它具备通过独立思考、调用工具去逐步完成给定目标的能力,分为单智能体和多智能体两大类。
单智能体通过试错学习在单一环境中行动,追求最大奖励,多用于简易任务。多智能体在博弈环境中行动,追求长期累积奖励,多用于复杂测试。
技术架构
根据《A survey on large language model based autonomous agents》智能体综述文章,Agent核心具备的四个核心特性与模块。
Profile:目的设定智能体的角色,比如编程专家、老师、领域专家等,并说明其年龄、职业、心理、社会关系等信息。
Memory:负责存储环境以及先前对话记忆,可以帮助智能体积累经验,自进化,变成一个更一致、更具逻辑、更高效的"人",并指导下一步的行动。
Planning :规划是Agent的决策中心,它将目标分解为可执行的步骤,并制定实现目标的策略,完成任务后进行反思总结。
Tools:利用外部资源或工具来增强其感知、决策和行动能力的过程,这些工具可以是API、软件库、硬件设备或其他服务。
演进趋势
10月18日,中国信通院发布全球首份《终端智能化分级研究报告》,提出了终端智能体的“进化”路线。
L1是基础响应级,可被动式服务;L2是智能辅助级,可半主动式服务;L3是智能代理级,可主动式服务;L4是智能协同级,可协同式服务;L5是自主智能级,可自主式服务。
从L1到L5,也意味着智能体将从现在的听令而行,变成未来的自主创造,有望重塑大模型产业生态,驱动人工智能产业变革。
据有关机构测算,预计到2028年国内智能体市场规模将达到8520亿元,其间年均复合增长率为72.7%。在可预见的未来,AI智能体将帮助多个行业构建起以“人+AI数字员工”为核心的智能化运营新常态。
例如,在医疗领域,AI智能体可以协助医生进行诊断、治疗和健康管理;在交通领域,AI智能体可以通过分析数据和实时路况,为交通管理和规划提供科学依据;在教育领域,AI智能体可以提供智能辅导和自适应学习系统,帮助学生更好掌握知识。
--THE END--
来源:中国信通研究院、央视新闻等公开资料