ChatGPT后下一个风口:Agent成大模型最热创新方向
华夏时报(www.chinatimes.net.cn)记者 付乐 冉学东 北京报道
“金融行业里的所有环节都值得用大模型重做一遍”,近来这种观点被反复提及。金融业作为人工智能应用场景密集的行业,是大模型技术落地的重要领域之一。
“对于垂直行业而言,将大模型对接应用场景才能发挥最大作用。”9月15日,百融云创AI创新负责人陈昀彰在接受《华夏时报》记者采访时表示。
目前,大模型最火热的研究和应用方向是Agent智能代理,随着越来越多人工智能的突破,大模型将在多模态、智能代理和具身智能方向逐渐落地,会给人们的工作和生活带来比移动互联网更大的改变。
大模型+场景
自从去年底ChatGPT横空出世,AIGC、生成式人工智能、语言模型、大模型等概念层出不穷。进入2023年后,企业纷纷试水,开启了“百模大战”。
“一本正经地胡说八道”“你会觉得它很聪明,却总犯低级错误”,这是当下人们对于大模型的观点之一。
在复旦大学教授、博导肖仰华看来,生成式大模型的根本难题就是它的“幻觉”现象。
“幻觉”即大模型在人机对话中给出一些事实错误。生成式大模型非常擅长创造,往往是创造有余,但是事实的准确性不足,而且自身很难从根本上解决问题。
此外,大模型还面临缺乏忠实度的问题,用户希望大模型按照用户自身给的规范、制度、文档回答问题,而不是从通用领域习得的知识回答问题。
比如金融行业往往是用长文本表达,需要大模型对长文本进行摘要。当客户打电话过来讲了七八分钟不知道在讲什么,实际上重点只有两三句话。然而一旦文本输入长度变长,很多大模型效果就变差了。如何提升大模型对长文本的认知能力?这就需要大模型去处理、去理解。
“金融机构需要的不是大模型本身,而是能够解决某个具体的业务场景。”陈昀彰表示。
在陈昀彰看来,现在大模型的实际应用,给人的感觉还是“差点儿意思”,很难作为真正的“工具”来使用。强化大模型的“工具”能力,通过对话的方式让大模型自主的完成一些指令,这在生产力场景里可以解决很多问题。
“大模型一定要和具体场景相结合,才能发挥最大效率。”陈昀彰表示,决定大模型落地最重要的因素是应用场景,因为只有在实际的交互场景中,才能决定用户需要哪些功能,以及可能以何种方式与这些功能产生链接。
例如,在小微企业风控场景里,很难利用合同、发票等非结构化的数据做判别,通过大模型可以提炼成相对结构化的结果,进入到风控模型中,这对小微企业的风控可以有更多维度的信息补充。
Agent成大模型最热创新方向
肖仰华表示,最近这几个月,大模型迅速地向一个自治智能体的大佬方向去发展。这不仅把大模型当做某类数据处理的基础模型,而是已经当作未来适应复杂环境的自治智能体的大佬。另外它有非常强大的规划能力,能够自主地发起很多API的调用能力,既有知识又有认知能力,还有工具的使用能力,这足够胜任一个自治智能体的大佬。
陈昀彰也表示,在大模型最新发展动向中,目前最火热的研究和应用方向可以说是“Agent智能代理”。
到底什么是Agent?
想象大模型是一部百科全书,需要不断交互才能查询。相比之下,Agent就像具备强大分析能力的研究助理,不仅掌握了所有百科知识,也能执行复杂任务,理解人们的需求和习惯,并做出调整。
陈昀彰分析到,基于大模型对自然语言的理解和生成,可以让Agent针对其所处环境和指定的目标,使用基于文本存储的记忆,并进行反思和评估,不断调整策略,进一步拆解目标和路径,制订下一步的方案和行动计划,同时利用文本生成的能力,调用各个工具,最终达成指定目标,这整个过程无需人工介入。
目前,大模型还不能作为一个全方位的AI解决方案,在主动学习机制,复杂决策,以及很多跟自我相关的自我管理、自我调整、自我控制等方面仍有很大的发展空间。这也是为什么,当创业者利用大模型来执行复杂场景落地时,会尝试使用Agent。
陈昀彰表示,以某家银行的信贷存量客户运营为例,针对银行存量运营策略单一、人员短缺等痛点,大模型运用决策树、最优化算法等策略体系纠正传统模型体系的精准度偏差,解决此前银行大量灰度人群区分度不够的问题,从而制定不同的经营策略。
去年和今年初,美国大模型初创企业的关注点多在对话生成,今年四五月之后,这一方向的创业企业偏少,更多的聚焦于某个生产力场景下,利用大模型让Agent自动完成更多的操作。而今年下半年,国内做这个方向的企业也变得更多。在这一路径的探索上,中美企业在基础模型上略有差异,国外更多的是基于GPT4。
业内普遍认为,Agent将成为大模型下阶段的必经之路,化身“数字打工人”,大大提升工作效率。