承接上文,下面让我们来分析一下开源与闭源在认知架构领域的发展,我们分别以 LangChain 和 OpenAI 作为开源与闭源两个阵营的代表。
OpenAI 作为 AGI 领域的明星公司近期推出的 GPTs 系列产品,是强力推动 Agent 认知架构的代表。通过其独立性和主动性,GPTs 可以自主访问知识、调用工具,并基于对话历史自主决策。这类似一个比过去对话系统更为主动、智能的代理人。
OpenAI 在推出 GPTs 系列消费产品的同时,还专门为开发者准备了 Assistants API 这个工具。这可以看作是面向开发者的认知架构服务。Assistants API 为用户提供了类似代理人的智能体系统:
它内置了对话式交互、代码执行和知识检索等功能模块;
开发者可以基于这个框架,扩展自己所需的决策工具和流程;
Assistants API 帮助记录状态,负责决策与工具调用之间的调度协调。
这相当于一个半成品的 Agent 架构,开发者只需在此基础上进行二次开发,就可以获得一个工作的智能代理人。这种高度自主的 Agent 设计理念,与 OpenAI 追求的 AGI 目标十分吻合。他们寄希望于通过不断完善这种结构,LLM 可以获得越来越强的思考与决策能力,最终实现通用智能。
与此形成对比的,是开源社区构建的认知架构工具体系。以 LangChain 为代表的开源工具,提供了丰富的样本代码、集成模板、调试工具等资源。开发者可以自主搭建认知架构,无需受限于任何厂商。LangChain 的方法也更倾向于给系统设计明确的状态转换逻辑 —— 它们构建了类似多步工作流的链条式或者状态机式的认知架构,在不同场景间转移更加可控。这虽然牺牲了部分自治性,但可靠性和适应性都更强。
比如 LangChain 推出的 OpenGPTs 项目,就是试图复刻 GPTs 式产品的功能以及开发者版的 Assistants API 的功能。作为一个开源系统,OpenGPTs 的最大优势就在于它提供了高度的可自定义性。比如用户可以选择集成不同的语言模型,通过 LangChain 已经支持 60 多个知名大语言模型。此外,OpenGPTs 也让用户更容易添加自定义的工具,实现特定域的定制化应用。
OpenGPTs: https://github.com/langchain-ai/opengpts
OpenGPTs 带来的自定义维度主要包括:
语言模型的选择:已默认集成 GPT-3.5 Turbo、GPT-4 等多个模型,还可轻松添加其它大语言模型。
提示工程的调优:通过可视化平台 LangSmith 进行提示策略的调试。
自定义工具的添加:如以 Python 方式实现的定制工具,可直接接入系统。
向量数据库的切换:可在 60 多个预集成的向量库中选择。
检索算法的配置:可以自定义使用的检索算法。
可以看出,OpenGPTs 为用户提供了从底层模型到提示策略再到工具链的全流程定制。这类似于一个开放的认知架构搭建工具箱。用户无需受限于任何厂商,可以自主控制各个层面的技术细节。所以作为开源社区的代表,LangChain 其实也相当于提出了另一套系统架构的设计理念,其认知架构设计更强调:
增加外部系统对语言模型决策的约束指导;
为不同问题空间设定不同的状态转换机制;
主动将相关上下文知识推送给语言模型;
大语言模型负责在给定的状态及场景中制定最优决策。
这相比 OpenAI 更加强调外部系统与语言模型的协同。牺牲了一定的自主性,但可解释性与稳定性都更强。LangChain 通过这种设计,也可以催生更多用于构建智能体系统架构的开源工具。
综上所述,开源与闭源社群目前在认知架构领域都展开了一些行动:
OpenAI 正在发展高度自主的 Agent 架构,并在商业化环境下不断完善;
LangChain 等开源社区更强调可解释、可控,提供开放的认知架构工具。
AGI 认知架构之路上的开源和闭源,如何发展、演变?让我们拭目以待!