当前位置:首页|资讯

【万字长文】国内外RPA产品升级AI Agent,RPA Agent持续演变未来机会在哪里?

作者:互联网演义厅发布时间:2024-09-18

  • 【万字长文】RPA的AI Agent进化,为RPA厂商带来了哪些优势和机会?
  • 全球RPA Agent产品大盘点,RPA与AI Agent混合自动化迎来全新机会
  • 国内外RPA产品升级AI Agent,持续演变的RPA Agent未来机会在哪里?
  • RPA与AI Agent融合的产品及解决方案是怎样的?有什么优势?一文看懂
  • RPA与AI Agent融合产品是怎样的?有什么优势和机会?未来发展如何?
  • RPA产品集体进化AI Agent对企业自动化有哪些影响?看完这篇你就懂了,附9篇相关论文

全文约13000字,阅读时间20分钟

文/王吉伟

可能就连技术圈也没想到,AI Agent的火爆再次带火了RPA。

ChatGPT横扫全球大语言模型风靡海内外之始,就有很多人断言了RPA的终场。但现在再看,RPA不但没有死,还在最新技术的加持之下,发展出了RPA Agent以及具备自主性的数字员工。

传统RPA确实已死,融合LLM与AI Agent的RPA风头正盛。

扩展阅读:基于AI构建的当代RPA,在生成式AI影响下的生命周期还有多长?

LLM火爆之后不久,应用方向上便落点到了AI Agent。由于API数量不够多、稳定性欠妥等系列问题,大家研究到AI Agent的执行能力后,发现当前阶段“UI+API自动化”是大幅提升AI Agent执行能力的重要方式。

而“通过API+UI自动化为企业提供”早已被Gartner写进2022年的RPA魔力象限报告。Gartner曾在报告中预测:到2024年,95%的RPA供应商将通过API与UI集成提供自动化。

扩展阅读:API与Ui集成新趋势下的RPA:海外厂商领先一步,国产厂商现状如何?

单是RPA的UI自动化能力,就已决定它可以是吴恩达教授所说的AI Agent四种设计模式里的“工具使用”的超级工具。而其所集成的大量的企业级API和各种连接器,则可以进一步实现AI Agent所触达不到的各种基于企业管理软件的业务流程。

通过API调用RPA,再用RPA通过API+UI参与现实世界中的更多复杂业务流程,这个模式足以让AI Agent在任何业务场景落地。

AI Agent执行能力不足这个问题,也引起了学术界对RPA的兴趣,LLM及AI Agent与RPA的融合自然也就成了被关注的焦点。对此感兴趣的朋友,可以参阅下面几篇论文:

1、PromptRPA:根据文本提示在智能手机上生成机器人流程自动化

PromptRPA: Generating Robotic Process Automation on Smartphones from Textual Prompts

论文地址:https://arxiv.org/abs/2404.02475

2、ProAgent:从机器人流程自动化到智能体流程自动化

ProAgent: From Robotic Process Automation to Agentic Process Automation

论文地址:https://arxiv.org/abs/2311.10751

项目地址:https://github.com/OpenBMB/ProAgent

3、AUTONODE:用于认知GUI自动化的Neuro-Graphic自学习引擎

AUTONODE: A Neuro-Graphic Self-Learnable Engine for Cognitive GUI Automation

论文地址:https://arxiv.org/abs/2403.10171

4、SmartFlow:使用 LLM 实现机器人流程自动化

SmartFlow: Robotic Process Automation using LLMs

https://arxiv.org/abs/2405.12842

5、FlowMind:使用LLM自动生成工作流

FlowMind: Automatic Workflow Generation with LLMs

https://arxiv.org/abs/2404.13050

6、使用基础模型实现企业自动化

Automating the Enterprise with Foundation Models

论文地址:https://arxiv.org/abs/2405.03710

项目地址:https://github.com/HazyResearch/eclair-agents

7、CAAP:仅使用前端UI解决计算机任务的上下文感知操作规划提示

CAAP: Context-Aware Action Planning Prompting to Solve Computer Tasks with Front-End UI Only

https://arxiv.org/abs/2406.06947

8、以人为本的自动化

Human-Centered Automation

https://arxiv.org/abs/2405.15960

9、指南:用于执行的图形用户界面数据

GUIDE: Graphical User Interface Data for Execution

https://arxiv.org/abs/2404.16048

随着Coze、Dify等AI Agent构建平台的火热应用,熟悉RPA的朋友惊叹,这不就是RPA的升级版吗。之所以这么说,很大一部分原因在于AI Agent构建页面像极了RPA。空口无凭,看看下面这张Coze工作流构建界面与RPA构建界面的对比图。

Coze工作流构建界面 VS RPA业务流程构建界面

有人很不解,明明是不同性质的产品,为什么要把AI Agent和RPA做对比。有这种看法,大抵对AI Agent的“Tool Use”不太明白,也有可能对RPA与AI Agent的融合不太了解。对于RPA与AI Agent的区别和联系,可以参考下面这张图。感觉这些内容不够详细,大家还可以搜索或者问问大模型,网上有很多相关的资料。

事实上,RPA Agent已经成为AI Agent家族的一个重要品类,并在企业应用中流行开来。在企业级应用中,广大组织对于RPA与AI Agent及LLM的融合的探讨已经远远超过AI Agent本身。

一方面在于大量企业都已经部署了RPA,很多业务流程的自动化依赖RPA。Gartner曾在两份报告中预测:

  • 到2023年底,90%的大型和超大型组织将部署某种形式的机器人流程自动化(RPA);
  • 到2024 年,75%的政府将启动或实施至少三项超自动化计划,RPA则是实现数字现代化的关键组成部分。

所以,广大组织定然不能让这部分投资白费,必然会进行RPA与AI Agent的技术融合,况且这也是企业自动化趋势。

另一方面,RPA能够以极低的投入极大地提升AI Agent在企业复杂业务流程的执行能力,是当前理想的AI Agent拓展工具。如何将RPA和AI Agent结合起来提高企业运营效率,可以算是已经采用RPA的企业问的最多的问题之一。

还有重要的一点在于,RPA Agent能够主动思考怎么去做一件事。想象一下:以前的RPA都是基于事先定好规则的,仅是一个只会拍手欢迎客人的木头人;现在融合Agent的RPA不但会拍手欢迎,还会询问你来的目的并带你去餐厅帮你点菜。这样来看,未来的想象空间是不是瞬间倍数级扩大了?

此外,融合AI Agent的RPA数字员工,也是AI Agent的重点研究方向之一。现在RPA厂商推出的数字员工,已经晋级成为真正的执行能力更强的智能体数字员工了。

扩展阅读:【万字长文】数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向

面向广大企业将RPA升级为Agent的这个需求,RPA厂商们更是要与时俱进,使出浑身解数基于RPA做LLM与AI Agent的各种融合与技术迭代。由此,在市场需求日益旺盛和更多技术供应商的日益努力之下,RPA产品及解决方案集体实现了Agent进化。

那么,到目前为止都有哪些厂商推出了AI Agent产品或解决方案?都是什么形态的?RPA Agent有哪些优势和机会?未来的趋势是怎样的?本文,王吉伟频道用1.3万字为大家解读。

注:本文所提到的所有研报及论文都已打包,回复 RPA Agent 可获取。

海外RPA的AI Agent进化

8月份,全球咨询与研究公司Gartner发布了《2024机器人流程自动化(RPA)魔力象限》报告。报告预计到2025年,90%的RPA供应商将整合生成式AI技术,进一步提升自动化的智能化水平。

经过进一步的市场整合,加上企业战略方向的变更,今年入选这份报告的只有13家厂商。在报告中可以看到,领导者象限还是4家厂商,微软已经明显超越被SS&C收购的Blue Prism成为新的全球RPA新三大,SAP进入了挑战者象限,ServiceNow新晋愿景者象限。

利基玩家象限剩下了四家,国产厂商只有来也科技仍在此象限,执行能力和愿景完整性都有所提升。

短短1年,各象限的变化还是蛮大的。

关于这份报告就简单介绍到这里,毕竟提及报告主要是为了下面的内容。

王吉伟频道以这份报告顺藤摸瓜,了解到现在至少有四家厂商已经推出或者主打AI Agent模式,下面是对这些厂商及产品的相关介绍。顺便说一下,关于国产厂商来也科技推出的AI Agent产品,将放到国内部分来介绍。

Automation Anywhere:AI Agent Studio

7月,Automation Anywhere推出了AI + Automation Enterprise System将GenAI流程模型与其传统的自动化平台相结合,以改善客户的工作流程自动化。

该系统的一项突破性的新功能是能够使用新的AI Agent Studio构建自定义AI Agent。AI Agent Studio为所有级别的开发人员提供了低代码工具,以轻松构建、管理和治理自定义AI Agent 。开发人员可以从选择的基础模型开始,包括来自 AWS、Google Cloud 和 Microsoft Azure OpenAI Service 等的模型,并将在10月底支持检索增强生成(RAG)服务。

为 AI + Automation Enterprise System 提供支持的底层引擎是Automation Anywhere独特的GenAI流程模型。GenAI流程模型2.0专为推动更快的流程发现、30% 的自动化创建速度、90% 的文档处理准确性和50%的自动化弹性而设计 ,超出了LLM 本身所能提供的。这些模型使用来自Automation Anywhere云原生平台上运行的超过3亿个流程自动化的丰富元数据进行优化。

Automation Anywhere还推出了面向组织的并与Amazon Q Service集成的嵌入式企业助手Automation Co-Pilot,业务用户可以更快地在任何应用程序中完成工作,通过聊天交互获得按需帮助,以询问知识库问题、调用AI Agent或启动自动化。企业级Automation Co-Pilot可以嵌入到用户工作的任何应用程序中,并在组织中的任何系统中进行操作。

Salesforce:Einstein Service Agent

近期的Salesforce在AI Agent方面可谓动作频频。

先是在7月份推出了Einstein Service Agent,这是该公司的第一个完全自主的AI Agent。Einstein Service Agent无需预先编程的场景即可理解各种服务问题并采取行动,从而有助于提高客户服务效率。

Einstein Service Agent基于Einstein 1平台构建,通过分析客户消息的整个上下文,然后自主确定下一步要采取的行动,使用大型语言模型(LLM)进行交互。Einstein Service Agent 使用生成式AI根据公司可信的业务数据(包括 Salesforce CRM 数据)创建对话式响应,只需单击几下即可根据公司的语音、语气和品牌指南量身定制。

又在8月份推出了两个新的自主AI 销售Agent:Einstein Sales Development Rep (SDR) Agent 和 Einstein Sales Coach Agent。前者旨在自主管理入站潜在客户并通过自然语言吸引潜在客户提供 24/7 全天候支持,后者专注于通过逼真的角色扮演场景来提高销售团队的技能。

Salesforce计划在9月Dreamforce 大会期间推出Agentforce,该平台基于 Einstein1 低代码平台,用以以创建、测试和扩展自定义AI Agent。Agentforce使客户的定制AI智能体能够安全地利用Data Cloud整合所有企业数据,通过Flow自动化无缝执行任务,并通过MuleSoft轻松接入企业API。

在正式部署前,可以在沙盒环境中进行充分测试,确保一切运行顺畅。部署后,这些智能体可以在客户的应用程序、网站、社交媒体以及Slack中发挥作用。

Salesforce计划部署数百万AI驱动的Agents,并期望在商业领域达到10亿的规模。

ServiceNow: Now Assist 系列AI Agent

自去年以来,ServiceNow一直在积极推动生成式AI,在其工作流平台中集成了各种强大的AI功能。这些工作主要集中在Now Assist系列AI Agent上,它与公司的服务管理、客户服务管理、人力资源服务交付和工作流创建器模块集成。

2023年9月,ServiceNow发布了AI动力解决方案Now Assist,旨在提升其客户在 IT、客户服务、人力资源和开发领域的生产力和体验。Now Assist由ServiceNow自家的生成式AI引擎驱动,并推出了一个专门领域的“Now LLM”,旨在提高企业级的生产力和数据隐私。

11月,所有客户都能通过ServiceNow Store使用新的Now Assist in Virtual Agent、流程生成和Now Assist for Field Service Management产品。

2024年3月,推出了Now Assist for IT Operations Management AIOps,能够应用生成式 AI 通过分析警报并为运营团队提供有用的上下文来加快问题的解决速度。并在ServiceNow Impact中推出了一系列Impact AI加速器,旨在帮助公司加快ServiceNow 投资的价值实现时间。

5月,ServiceNow推出Now Assist的BYO GenAI模型功能,使得其智能体更加强大。客户可以选择任意大型语言模型作为Now Assist智能体的核心,无论是使用专有的LLM,如GPT-4 或Gemini Pro,还是自行开发定制的LLM,以优化Now Assist使用体验。

还发布了Now Assist for Strategic Portfolio Management旨在帮助产品经理通过客户提供的反馈来整合客户的独特需求。

海外的RPA厂商中,目前除了这几家推出了AI Agent,其他厂商几乎清一色主打Copilot。比如UiPath分别推出了面向开发人员和测试人员的UiPath Autopilot,还能与Microsoft 365 Copilot插件集成。Appian的最新版本业务流程平台,也增加了更多的Appian AI Copilot支持。

就连推出了Autogen、Taskweaver等开源智能体架构的微软,也是在其Copilot产品中增加了Power Automate插件以增强执行能力。

现在而言,Copilot这种LLM的应用模式,更符合当前的市场需求,差不多已经成为企业级应用的标配。不过按照Forrester对于自动化工具市场进展趋势的预测,到2028年厂商们都将在平台中增加AI Agent编排(AI-Agent orchestration)功能,所以早晚都会推出AI Agent解决方案。

对于这一点,从UiPath创始人Daniel Dines在最近的采访中大谈特谈AI Agent即可见一斑。

国内RPA的AI Agent进化

相较于国外RPA厂商目前重点耕耘Copilot,国内RPA厂商几乎都在重点布局AI Agent。从去年下半年开始,就陆续有厂商发布Agent与RPA的融合产品。下面,是截至目前厂商们已推出的AI Agent产品和解决方案的简单介绍。

来也科技:AI Agent数字员工

6月20日,来也科技在以“数字员工进入AI Agent时代”为主题的Laiye Lead年度产品发布会上,发布了三款基于数字化劳动力平台的高价值、可落地的AI Agent数字员工产品,分别是数字员工开发助手、知识管理和问答助手和文档审核与风控助手。

数字员工开发助手:采用多模态大模型技术,提高代码生成的效率与准确性。自动解析复杂Excel,按需生成自动化流程,简化开发并降低成本。扩展命令库能迅速产出Python代码,与RPA产品无缝对接,提升代码复用率和开发速度。"自愈"功能可自动适应UI变化,减少中断与维护成本,增强流程稳定性,保障业务连续性和效率。

知识管理和问答助手:结合大模型、RAG、RPA和IDP技术,实现了对这些文档的自动化理解和知识生成,为企业提供了一个智能化的解决方案。

文档审核与风控助手:提升企业文档处理的效率和准确性,保障企业现金流管理和业务运营风险的控制。

实在智能:RPA Agent智能体

2023年8月,实在智能发布自研垂直“塔斯(TARS)大语言模型”,在全行业首发产品级别Agent落地产品RPA Agent智能体(TARS-RPA-Agent),通过“自然对话式交互和超自动化执行打造全能业务专家”,再次大幅降低“数字员工”构建门槛,真正实现人人可用。并在12月,完成由金泰富资本和安吉智慧谷共同领投的近2亿元C轮融资。

2024年2月实在手机Agent智能体上线,3月底开放实在Agent智能体新版本第一轮公测。8月,正式发布了实在Agent 7.0。新版Agent 7.0具备以下几个特点:

  • 自然对话交互:“All in One”式助理工作体验;
  • 意图理解、流程规划:更为强大的意图理解+流程精准拆解规划能力;
  • 多代产品能力集成:实现一代RPA、二代IPA数字员工元素拾取、组件、流程编排等全部能力集成;
  • 软件界面精准操作:Agent多模态屏幕语义理解,屏幕扫描识别,界面精准操作;

同时,实在智能千亿参数训练的底层TRAS大模型也再次进化,训练参数量更大,支持自然语言沟通工作、科普知识,高效执行任务完成工作,对话工作两不误。

在智能问答方面,基于实在智能文档系统(IDP),能够给实现文件的精确问答及处理。

金智维:K-Agent

3月,金智维重磅发布AI Agent类新品K-Agent,并基于K-Agent平台打造金智维Kopilot,这是一个面向千行万业的智能助手(Copilot)应用集群,将大模型能力具象化,直接贴合企业的实际需求。

K-Agent平台具备智能交互、思考、分析、自训练等能力,可以进行持续学习和自我优化。用户基于K-Agent平台,可以实现快速开发、部署各类智能助手(Copilot)型数字员工,从而应对不同的业务场景需求。

在K-Agent平台上开发的智能助手依托精调的领域模型,能够自主分析任务指令并规划操作流程,生成RPA脚本调用对应的平台或应用,高效优质地完成业务需求,给出执行结果反馈或者问答用户问题,将复杂的业务决策转化为可执行的业务能力。

在技术上,K-Agent借助组合式AI技术,多种技术各取所长,强化智能助手的学习机制,让模型越用越聪明;在场景上,K-Agent植入行业专精知识库,保证行业所要求的知识的覆盖度、专业性、合规性和正确性,降低个性化服务成本。

壹沓科技:运小沓-Cuber数字员工3.0

2023年11月,壹沓科技发布了供应链专属大模型产品「运小沓•数字员工平台」,这是一个基于大模型的数字员工聚合及训练平台。

该平台可为供应链企业提供资深供应链运价经理、物流可视追踪经理、供应链新人成长师等高频业务场景的虚拟数字员工专家团队,为员工提供高效「所答即所问」的供应链领域准确知识,助力企业构建「白领员工+Al Agent运小沓数字员工」人机协作模式。

今年7月,运小沓-Cuber数字员工3.0,该产品的构建基于大模型的Agent 自动化操作入口,能够基于CuberAgent 引领供应链人机协作新时代。

作为基于供应链大模型的数字员工超自动化解决方案,运小沓Cuber围绕供应链上下游业务场景,涵盖上游生产制造、中间物流配送、下游批发零售,实现从营销获客、采销管理、仓储物流、拖车报关、履约执行、财务结算的全局超自动化。

值得一提的事,8月7日,壹沓科技宣布完成B+轮融资,本轮融资由鼎晖VGC(创新与成长基金)领投,新尚资本跟投。

艺赛旗:旗旗助手

大模型爆发以来,艺赛旗围绕易学、易用和稳定的RPA产品演进方向,将大模型与RPA进行深度融合。易学方面,利用大模型的语义理解能力,智能推荐完成该任务的操作步骤,方便用户快速掌握RPA的流程开发,提高学习效率和使用体验。

易用方面,借助大模型生成式AI能力,根据用户指令,将自然语言转化为代码,并集成到RPA设计器中,以提高开发者的流程开发效率。

4月,艺赛旗推出了旗旗助手(AI-agent),通过集成大模型的能力,基于用户的自然语言输入,可将其转化为可执行指令,并自动判断处理、执行自动化流程,还能以人类能理解的语言形式返回处理结果。

在稳定性方面,在流程开发过程中,艺赛旗利用大模型的知识库,协助开发者进行问题定位和错误排查,从而增强流程稳定性。

容智信息:Hyper Agent

3月29日,容智信息发布了2024新产品组合-覆盖全业务生命周期的12大产品矩阵,流程发现、分析、设计、自动化、执行、监视和重新评估等均囊括在内,其中包括闻道大模型与Hpyper Agent超级智能体。

5月下旬,容智Hyper Agent正式推出。该产品主要融合“闻道”大模型的应用开发能力和iBot数字员工的流程自动化能力,向上连接人的意图,向下指挥数字员工。借助大模型,Agent能更简单地驱动自动化流程,实现从规则性的重复能力模型,到逻辑推理、抽象总结、意图识别等自主复合能力模型的过渡,从而缩短系统开发链路,填补人与系统间的隔阂。

通过Hyper Agent,企业可以简单、高效地创建企业级Agent应用、编排工作流程,甚至一键切换大模型底座,构建更适合场景和个人所需的Agent。在自然语言交互的过程中,员工能借助iBot数字员工自动完成工作任务或执行特定服务。

达观数据:数字员工Agent平台

5月份,达观数据发布了数字员工Agent平台。达观智能数字员工融合了机器人流程自动化(RPA)的高效执行能力和“曹植大模型”的先进语义理解技术,实现知识库和大模型结合的企业应用。

在达观智能数字员工平台,RPA作为数字员工的执行核心,自动化处理重复性任务。曹植大模型则赋予其理解复杂语言和任务规划的能力,使数字员工能够精准捕捉并响应用户需求。

此外,通过知识管理系统,数字员工能够存储和利用历史数据,优化任务执行策略。这种结合不仅提升了企业运营的效率,还可推动业务流程的智能化和自动化。

新一代智能知识管理系统,以“曹植”大语言模型为基座,提供知识生产、知识组织、知识搜索、知识问答、知识图谱、知识社区等能力,并能将企业积累的海量结构化和非结构化文档经过自然语言技术处理和提炼,搭建更加智能化、人性化的知识管理系统。

中关村科金:AgentGraph应用开发平台

2023年11月23日,中关村科金正式发布了企业知识大模型、AgentGraph应用开发平台,以及“超级员工”系列AIGC应用,为企业提供开箱即用、系统无缝衔接、成本可负担的专属领域大模型服务。

中关村科金搭建了一体两翼的底层技术架构,形成四大类别产品体系。一体两翼指的是企业知识大模型,及其支撑平台领域大模型工厂、领域知识库工厂,四类产品分别是指智能营销、智能服务、智能运营、超级员工。

AgentGraph应用开发平台作为连接一体两翼和四类产品的中间层,适配十余款开源基础大模型,兼容性强支持一键切换,拥有50+应用模板,并将超过200+个AI能力组件化,可实现零代码、最快三分钟创建新应用,进一步降低客户创新成本、缩短开发周期。

AgentGraph集成中关村科金企业知识大模型,预置国内外语言、图像等多种类型大模型,功能全面,是企业级的一站式、全链路大模型应用开放平台,提供开放大模型调用、可视化任务流程编排、AI及系统工具组件、数据处理及存储、低代码应用构建、监控运营等应用开发工具。

金蝶:AI管理助手Cosmic

5月,金蝶推出了面向企业管理的AI管理助手Cosmic:超级智能。

Cosmic基于金蝶超过740万家企业的实践场景沉淀和万亿级训练数据,具备了听说读写的感知能力、能积累并利用管理经验的记忆能力、能理解并计划的思考能力以及能调动系统并实现的行动能力;并可以通过对话式交互和可协同、可扩展的AI应用,助力管理者及员工轻松应对财务管理、数据分析、合同处理、干部遴选等多项管理工作,让企业运转得更流畅、更高效。

目前,Cosmic覆盖财务、人力、供应链等多种业务场景,并致力于“让人人都有一个AI管理助手”;同时,Cosmic也将AI全线赋能金蝶面向大、中、小市场的各类SaaS产品。

用友:基于YonGPT 2.0模型的智能体

8月,用友正式发布用友企业服务大模型YonGPT 2.0。目前,基于YonGPT 2.0,用友BIP拥有分别基于智能体(Agent)、人机交互(HCI)、RAG应用框架的“智友”、“数智员工”、“智能大搜”3项重要产品,以及包括智能合同、智能订单生成、智能月结、AI面试、智能人才发现等100多个场景化的企业智能服务。

YonGPT2.0大模型作为平台层,其下层是通用的专业能力,如领域知识问答能力增强、PPT分析报告生成 、合同智能审核等等,保证模型在业务基础能力的支撑;在平台层本身,内置了各种“经验数据”,以帮助模型能够在专业数据的基础上通过几个应用框架进行微调来确保模型的效果。

比如遇到业务运营方面的问题,可以用Agent应用框架进行微调;人机交互问题,由人机交互应用框架去微调;知识生成或应用生成问题,都可以通过RAG业务框架来微调。基于这些应用框架,企业还可以通过AI Agent(智能体)构建器,将用友BIP中的应用、业务知识等,快速构建成满足各类场景需求的智能体,实现灵动化的企业应用创新。

从这些厂商们在GenAI及AI Agent方面做出的探索及推出的产品与解决方案来看,RPA技术厂商正在采取多种方法来发展其平台并满足不断变化的企业需求,通过不断的迭代与进化,以在AI Agent时代保持足够的市场竞争力,当然其中也有战略布局。

RPA的进一步演变

为了在AI Agent时代保持相关性,RPA厂商正在采取多种方法来发展其平台并满足不断变化的企业需求。从上文所列的多家厂商推出的产品与解决方案,我们可以总结出下面的RPA演变方向。

1、通过AI功能增强RPA

RPA技术厂商最适应的一种技术方式,是将AI功能整合到平台中。通过利用机器学习、自然语言处理和计算机视觉,RPA机器人可以变得更智能、适应性更强。这种集成使RPA 机器人能够处理更复杂的任务,做出明智的决策,并从与用户和系统的交互中学习。

将AI功能尤其是GenAI集成到RPA平台为自动化开辟了新的可能性。AI增强型RPA机器人不是简单地遵循预定义的规则和工作流程,而是可以从数据中学习、识别模式并做出明智的决策。这使企业能够自动执行更复杂的认知任务,例如欺诈检测、情绪分析或预测性维护。

AI增强的RPA机器人还可以通过机器学习随着时间的推移不断提高其性能。通过分析其操作结果并接收用户的反馈,这些机器人可以微调其算法并适应不断变化的业务需求。这种自学能力可确保RPA解决方案长期保持相关性和有效性。

2、专注于端到端自动化

RPA技术厂商正在将重点从自动化单个任务转移到实现整个流程的端到端自动化。通过将 RPA与AI Agent和其他自动化技术相结合,供应商旨在提供无缝和智能的自动化体验。

端到端自动化包括:将RPA与AI代理、业务流程管理 (BPM) 工具和低代码平台集成;跨多个系统和应用程序编排数据和任务流;为管理和监控自动化计划提供统一的平台。

端到端自动化的目标是从头到尾简化和优化整个业务流程。RPA厂商的解决方案不是自动执行孤立的任务,而是专注于创建可以处理跨多个系统和部门的复杂工作流程的整体自动化解决方案。

例如,面向组织中典型的采购到付款流程,融合AI Agent与RPA的端到端自动化解决方案将涉及:

  • 一个AI Agent,可以解释和提取采购申请和发票中的相关信息;
  • 一个RPA机器人,可以根据业务规则验证提取的数据并将其输入到适当的系统中;
  • 一种BPM工具,可以协调不同部门和利益相关者之间的任务和审批流;
  • 一个低代码平台,使业务用户能够根据需要自定义和扩展自动化解决方案。

通过提供端到端的自动化解决方案,RPA厂商可以帮助企业在运营中实现更高的效率、准确性和敏捷性。这些解决方案使组织能够打破孤岛,消除手动交接,并获得对其流程的实时可见性。

3、为平民开发者赋能

RPA厂商采用的另一种策略是授权平民开发人员创建和管理自己的自动化解决方案。通过提供用户友好的界面和低代码工具,供应商使几乎没有编程经验的业务用户能够构建和部署RPA机器人和AI Agent。

为平民开发者提供支持具有以下几个好处:更快地开发和部署自动化解决方案;减少对IT部门和专业技能的依赖;在适应不断变化的业务需求方面提高敏捷性和灵活性。

RPA厂商提供的低代码平台允许业务用户使用可视化拖放界面和预构建模板创建自动化解决方案。这些平台抽象出编程的复杂性,使平民开发者能够专注于设计其自动化解决方案的逻辑和工作流程。

例如,营销经理可以使用低代码RPA平台来自动化收集和分析社交媒体数据的过程。通过拖放数据连接器、数据转换AI模型等组件,无需编写任何代码即可创建自定义自动化解决方案。

通过实现自动化大众化,RPA厂商可以进入更广阔的市场,并通过专门的 IT 团队将其客户群扩展到大型企业之外。中小型企业也可以从自动化的强大功能中受益,而无需大量的前期投资或技术专业知识。

基于RPA的AI Agent优势在哪里?

2022年底ChatGPT引爆大语言模型后,RPA\超自动化厂商是跟进GenAI速度最快的技术供应商之一。从彼时到此刻,大部分厂商至少已经进行了从GenAI技术集成到AI Agent技术应用的两步迭代。

这样做除了提升产品能力、降低资源损耗之外,主要目的自然是在市场端应对与OpenAI、Google、初创公司以及现有投资组合供应商等诸多企业的市场竞争。

如前文所述,很多RPA厂商已经推出了融合GenAI及AI Agent的产品和解决方案,展示了IT 如何构建机器人和创建文档提取模型、安排复杂的商务旅行以及提供医疗保健方面的指导。但仍有很多组织对RPA厂商能否在GenAI技术融合上做持续的创新,持有一定的怀疑态度。

在这方面,看好RPA厂商的Forrester副总裁兼首席分析师Craig Le Clair足足给出了六个理由。如下:

1、LLM首先会作为微自动化采用,提供低级认知支持。这种应用很多都将发生在运营或后台流程中,这是GenAI与RPA结合的最佳点。现在,我们已经看到GenAI开始选择结合RPA机器人或数字流程自动化(DPA)工作流来运行,这将是今后企业业务流程自动化的主流形式。

2、RPA平台非常适合构建代表企业或个人行事的高级AI Agent, 无需广泛的编程规则。AI Agent是一项重要的技术趋势,能够以不同程度的自主性做出决策和行动来执行服务。例如,基于RPA的Agent(RPA Agent)从银行的反洗钱系统接收警报,可以结合公共和私人数据档案并完成了1级调查,大幅降低误报情况,这在之前基于预制规则的AI+RPA是无法实现的。

3、成熟的RPA平台架构能够管理数千个自动化,意味着AI Agent的集中管理正在激增。RPA 供应商已经投资流程智能以提供“动态工作管理”,Forrester认为到2026年,从正在运行的流程中挖掘的数据可以管理人类和AI Agent之间的工作。

4、广大组织已大量部署RPA,愿意尝试基于RPA扩展AI Agent。数以千计的公司已经建立了RPA平台,并愿意将它们用于注入基于LLM的Agent以更好地利用其技术投资,提升技术投资回报率。

5、RPA的快速发展的一个原因,在于其能够通过UI轻松与现有工作模式集成,这对于未来更智能的Agent仍然很有价值。RPA领导者正在投资AI驱动的工作流程,以提供更强大的端到端编排,预计到2027年将广泛应用。

6、GenAI 面临的最大挑战,是信任和数据安全。十多年来,RPA平台一直在努力解决安全管理自动化的问题。例如,一个挑战是安全管理机器人用于访问核心系统的人类凭证,这是目前GenAI初创公司和超大规模企业难以做到的。

以上这六个原因,第二条尤为关键。为了与大语言模型企业、科技巨头企业以及更多的AI Agent的竞争,RPA平台需将自身定位为构建、部署和管理这些智能代理的首选解决方案。这意味着RPA平台需要提供强大的工具和框架,让企业能够轻松地创建、部署和维护AI Agent。

超大规模公司和初创公司的产品可能更倾向于通用性,而不是针对特定用例,这可能会导致买家在使用这些产品时被限制在特定的平台上。所以,RPA给出的RPA Agent解决方案应该将适用于超大规模公司和初创公司,而不是特定于用例。

而为了在竞争中取得成功,RPA平台需要保持不可知性,即不依赖于特定的技术或平台。这样可以确保RPA平台能够适应不断变化的技术环境,并满足不同客户的需求。因此,RPA平台及其服务合作伙伴,通过为客户供特定于领域的AI Agent更容易成功。可以针对特定行业或业务场景开发定制化的智能代理,从而提供更加精准和有效的解决方案。

RPA与AI Agent结合的市场机会

近十年来,企业自动化在持续演变,但总体都是基于UI与API自动化技术的迭代发展。RPA技术在2010年代中期由UiPath等公司推广,以其录制和回放的UI自动化功能,推动了低代码业务应用的兴起。

RPA的稳定性和自动化的持久性曾受质疑,但如今仍有大量企业建立了自动化卓越中心,并发展至智能自动化(IA)。IA融合了RPA、API自动化和OCR文档处理等技术,标志着从简单的点击自动化向更复杂的流程自动化转变。

这些工具结合了编码与低代码,需要专业技能部署,但核心仍是基于规则的自动化,适合结构化流程。

与此不同,AI Agent采用先进的规划和执行策略,能灵活理解非结构化数据和流程。它们适用于那些无法用规则简单定义的工作,展现出比传统RPA更强的适应性和弹性,能在出错时自我修正或寻求人工协助。

尽管AI Agent为企业自动化领域带来了革命性的变化,但并不意味着RPA技术的终结。对于那些需要大量重复性数据录入或迁移的任务,如每天输入1000条记录到ERP系统,或迁移10万条电子健康记录,显然这类基于规则的自动化更适合RPA,而AI智能体并不是最佳选择。毕竟,工具的选择应基于任务的性质。

AI Agent拓宽了企业自动化的边界。AI智能体是一个仍在形成的新类别,当前而言拓展Agent用例的最简单方法就是将Agent推理扩展到现有的自动化例程。随着时间推移,AI Agent将会扩展到企业战略核心业务工作流程。

sema4.ai联合创始人Antti Karjalainen认为,AI Agent和企业自动化的结构可以分为三个层次,如下图:

基础层:涉及大量战术性工作,这些工作不需要复杂的决策,而是在特定上下文中运行,需要处理企业特有的数据、文档和系统。

这是RPA的强项,也是启动AI Agent项目的合适起点。通过在RPA例程之前和之后的工作流程中寻找机会,通过 Agent扩展自动化范围,并进一步使用AI Agent将自动化范围扩大到标准RPA所能达到的范围。

中间层:沿着金字塔向上移动,中间层的工作涉及在标准环境中运行的标准决策,产品与工作形式为Copilot。

一般而言,这一层通常是由ServiceNow或Salesforce等记录平台和系统捕获的工作。在这一层,采用技术供应商提供的AI和自动化解决方案及其数据和流程进行创新的能力,用户将得到最好的服务。因此在未来的企业自动化中,Copilot这种形式也将充分融合AI Agent与RPA,同样是RPA巨大的机会。

顶层:金字塔的最顶层,是最具战略意义的工作类别,对企业如何开展业务和运营至关重要。这一层会涉及复杂决策并需要特定上下文。这类工作是企业存在的核心,也是定制化的企业级AI Agent能够发挥最大作用的地方。专为特定目的而构建的战略性企业级AI Agent,将会成为企业未来发展的重要应用。

从企业自动化与AI Agent应用的三个层次来看,不管是战略布局还是战术应用,企业都应该在现有的RPA\超自动化技术体系下做各种尝试与融合,以让基于RPA的AI Agent和融合RPA和Agent的混合智能工作流在业务流程中发挥最大的功效。

因此,三个层次中企业自动化的AI Agent与RPA的融合进程,也正是广大RPA厂商及Agent厂商的机会。

Agent时代RPA市场的几个趋势

Gartner关于RPA行业的魔力曲线报告数据显示,最近几年RPA软件市场一直在持续高速增长。到2022年RPA软件市场达到28亿美元,增长率降到了22.1%,仍是全球软件市场增长的两倍速。即便是在生成式AI和大语言模型凶猛来袭的2023年,RPA仍然保持了22%的市场增长率,同时市场规模也达到了32亿美元。

在2023年的RPA魔力象限报告中,Gartner提到了RPA市场的三个关键趋势,如下:

1、AI是RPA供应商战略的核心

为了应对围绕 AI 和 LLM 的炒作,RPA 供应商正在战略性地将其平台定位为更加以 AI 为中心的未来必不可少的工具。

供应商正在设计产品路线图,专注于提供 AI 信任、风险和安全管理 (TRiSM)、增强的AI 技能和工作室、扩大对通用 LLM(来自 Amazon、Anthropic 和 OpenAI 等公司)的访问,以及开发专有的专用 LLM。并强调,在短期内,客户可以预期RPA平台中的AI开发功能将产生改进的自我修复能力、脚本修复和IDP提取准确性。

2、RPA供应商在GenAI自动化开发方面投入了大量资金

RPA供应商正在大力投资 GenAI,以帮助客户开发自动化。大多数供应商都专注于创建基于提示的开发功能,将自然语言请求转换为自动化工作流程。这使得自动化开发的技术性较低,并且更广泛地可供组织中的平民开发人员使用。

基于提示的开发是启动更大规模的自动化工作或设计简单工作流程的有用工具,但基于提示的开发目前在为复杂工作流程构建端到端自动化方面的用途有限。如果客户能够以合理的价格访问这些新兴功能,则应尝试基于提示的自动化开发。

长远来看,客户期望供应商开发更高级的AI增强自动化开发功能。作为迈向自主业务的重要一步,GenAI 最终可能会从任务挖掘技术中提取录音,并自主构建自动化来模拟员工定期执行的任务。

3、RPA 供应商提供更广泛的编排和自动化

目前大多数RPA供应商通过支持多种自动化技术(包括 IDP、BPA、对话式 AI、LCAP、流程挖掘、任务挖掘、测试自动化和iPaaS)来提供超越RPA的平台。这种融合到更大的自动化平台,需要跨原生集成和第三方解决方案的强大编排能力。

客户期望RPA提供商在如何打包和定价产品方面变得更有创意。供应商明白客户不想为他们不需要的技术付费,但供应商也知道,如果新技术打包在一个低成本、低风险的捆绑包中,客户可能会试用这些技术。为了充分利用捆绑的自动化功能,客户应该寻找提供强大流程建模和治理以及统一用户体验的平台。

以上看起来是3个趋势,事实上主要强调了两点:一是AI尤其是GenAI正在成为RPA的核心部分,能够推动RPA更简单的深入应用;二是融合GenAI之后,需要更强大的原生集成、第三方解决方案和编排能力。

这两点,也决定了RPA自动化平台能够更快更好地融合GenAI,形成适用于广大组织的企业级解决方案。而有着多年积累并已打造出端到端自动化平台的RPA厂商,更适合做这些事情。这个优势,也是目前大部分通用AI Agent构建平台所不具备的。

AI Agent时代RPA的未来

随着AI Agent的不断发展和变得更加复杂,RPA的角色无疑将发生变化,但这并不意味着 RPA将过时。这就需要RPA厂商必须适应并找到与AI Agent和集成的方法,以提供更全面、更智能的自动化解决方案。AI Agent时代RPA的未来发展,有以下几个可能。

RPA与AI智能体的融合

未来,RPA的角色将转变为与AI智能体紧密集成的伙伴。这种集成不仅仅是技术上的结合,更是在工作流程中实现优势互补。RPA的精确性和效率,结合AI智能体的智能决策和学习能力,将共同推动自动化向更高层次发展。

无缝集成与混合自动化

RPA机器人与AI智能体之间的无缝集成,将使得自动化流程更加流畅和高效。例如,AI智能体可以处理自然语言理解、图像识别等复杂任务,而RPA机器人则可以执行基于规则的重复性操作。这种混合自动化解决方案,能够同时处理结构化和非结构化数据,提供更全面的自动化服务。

智能编排与持续学习

在智能自动化架构中,任务和工作流的智能编排将成为关键。RPA和AI智能体将能够跨多个系统和技术协调工作,实现端到端的自动化。此外,通过持续学习,自动化解决方案能够根据数据和用户反馈进行自我优化,以适应不断变化的业务需求。

专业和垂直化的自动化解决方案

RPA的未来还可能涉及开发更专业和垂直化的自动化解决方案。这意味着RPA供应商需要深入了解特定行业的需求,创建定制化的模板、预构建的集成和AI模型。例如,在医疗保健领域,自动化解决方案可能需要处理病人数据和医疗记录;而在金融行业,则可能需要处理交易数据和风险评估。

“即服务”模型兴起

随着云计算技术的发展,RPA和AI的“即服务”模型将越来越受到企业的欢迎。这种模型允许企业通过订阅云平台来访问各种RPA机器人、AI智能体和自动化工具,而无需在本地购买和部署自动化解决方案。这种方式不仅能够降低企业的初始投资成本,还能够根据实际使用情况灵活调整资源,实现按需付费。

人机共生的未来

随着RPA和AI技术的不断发展和融合,未来的工作场景可能会更加注重人机共生。在这种模式下,人类、RPA机器人和AI智能体将各自发挥自己的优势,互补彼此的能力。人类将专注于创造性和策略性的工作,而RPA机器人和AI智能体则处理重复性和技术性的任务。这种共生关系将提高工作效率,释放人类的潜力,同时也为RPA和AI智能体提供了更广阔的应用空间。

总之,RPA和AI智能体的结合,将为自动化领域带来无限的可能性。通过无缝集成、智能编排、专业定制和即服务模型,企业将能够构建更加智能、灵活和高效的自动化解决方案,以应对日益复杂的业务挑战。

全文完

【王吉伟频道,关注AIGC与IoT,专注数字化转型、业务流程自动化与AI Agent,欢迎关注与交流。】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1