今天分享的是:生成式AI企业应用落地技术白皮书:致广大而尽精微(报告出品方:神州数码)
报告共计:77页
海量/电子版报告/来源公众号: 优选报告库
在大模型时代之前,智能体(Agent)的概念就已经出现在强化学习领域,能通过感知环境的状态并根据已有的行动策略选择对应的动作,并影响环境状态的变化。在大模型时代,智能体得到了大模型强大的生成能力的加持,对自身与环境的理解相比于传统的神经网络更加深刻,能够在自由度更高的情况下生根据宏观目标生成行动规划,从而应用于环境更加多变的应用场景中。
基础的智能体结构包含了三类主要功能组件:规划器、感知器、以及执行器。这三个组件的相互结合为智能体带来了强大的任务解决能力以及环境适应能力。
规划器: 大语言模型驱动的规划器通过对宏观任务的理解、环境与自身的感知、以及先前行动结果反馈的记忆与解析,综合思考并规划出下一步骤的行动。其背后的设计方法类似于思维链的设计思路且有多种,例如:ReAct式的逐步规划、BabyAGI式的统一规划、多路径式的最优路径规划等等。在计划生成之后,后续可以通过观察行动执行结果对计划进行反思及优化(Reflection and Refinement)。规划器对模型文本理解与生成能力的要求较高,需要有良好的上下文理解能力、指令遵循能力和步骤推理能力,以便综合考虑所有相关信息,让思考过程易于解析以及将宏观目标解析成合理的中间步猥。
感知器: 感知器为规划器提供了信息来源,这些信息可包括:
1、环境与自身的状态:对环境与自身的感知除了常规的文本模态、也可以是视觉、听觉或者其他模态的感知方式。为了让规划器能够充分利用得到的信息,需要将不同模态的信息统一成规范的文本模态。
2、行动的反馈: 规划器通过解析行动结果来判断出行动是否成功达到预期,从而规划出下一步的行动。在这个过程中,需要感知器观察并解析每一步的输出,并从中提取关键的信息传递给规划器进行判断。
3、记忆: 对于具有学习能力的智能体,通过收集先前步骤的计划、观察与反思结果能够帮助模型更好地适应环境。通过先前步骤执行的完成度来辅助下次相似场景下的行动规划,能让后续行动的计划更加有效。基于感知器所能提供的不同种类的信息来源,规划器才能不断地在环境中做出正确的判断与决策,生成适应环境的行动规划。
执行器: 在智能体的工作流程中,计划中每步的行动都基于工具的使用。执行器需要将来自规划器的行动指令转化成工具的选择以及符合规范的工具输入,因为大部分工具难以直接解析模型输出 的非结构化的文本。在行动完成后,需要执行器及使用的工具生成行动结果的反馈,并传递至规划器用于生成或调整下一步的行动规划。
智能体的组件在设计的过程中可以根据应用场景的需要选择不同的设计方法,就例如规划器可以使用逐步规划或者统一规划、单一路径或者多路径的方式,感知器可以基于不同的模态或不同的解析方式,执行器则可以使用现有的 API接口成者自己设计的工具。设计者能根把场景需要选择合适的组件设计方案。
在自由度较高的应用场景中,可以通过让智能体获得学习能力来提升其环境适应性。智能体通过记录与对象交互的方式和结果,在未来处于相似的场景时能够做出更好的判断与行动。目前,智能体可以通过长期记忆和编排新工具的方式来进行学习。长期记忆的实现是通过向量数据库,记录多轮对话的模型输出与用户输入,智能体会回忆先前相似场景下的会话记忆,并综合用户的反应生成更加符合用户意图的输出。编排新工具则是根据任务、环境和自身状态,通过利用现有工具来构建有效的工具使用流程。将这些流程连同其功能描述一起储存到工具库中,以便智能体在未来的类似情境中能够重复使用这些新工具,这种方法也是智能体学习的一种方式,工具在此处可以是由代码成者提示组成,都是通过编排基础的工具来创造新的工具。先前英伟达和多所美国大学联合研究的 Voyager项目中就提到了这种能够让智能体在自由环境中根据宏观目标终身学习的方式。
报告共计:77页
海量/电子版报告/来源公众号: 优选报告库