大型语言模型(LLM)的崛起曾引发RPA(机器人流程自动化)将被淘汰的论调,但随着AI Agent的发展,人们意识到API并非万能。多数Agent局限于简单场景,难以触及复杂业务流程,导致其在企业运营中的影响力有限。 为此,Agent开始结合UI自动化,利用API高效交互数据,同时解决非接口软件的连接问题,以更好地融入企业管理软件。 国内外,众多厂商积极探索Agent与RPA的结合,推出创新解决方案,如实在智能首发TARS-RPA-Agent、OpenAI投资Induced AI、清华大学与智谱AI推出CogAgent,以及腾讯的AppAgent等。这些项目展示了Agent在自动化领域的广泛应用前景,并凸显RPA技术的持续进化。 RPA及超自动化厂商早已在API与UI兼容方面取得成果,为Agent与RPA的结合奠定了坚实基础。行业预测也显示,到2024年,多数RPA供应商将通过API与UI集成提供自动化服务,为用户提供更全面的解决方案。 大模型落地,离不开RPA2023年8月,实在智能在全行业首发产品级别的实在 AI Agent——“文生数字员工”,基于大模型,通过一句话即可生成自动化流程、软件机器人,为个人用户带来解决长尾低频自动化需求的智能助理,为政府企业带来员工办公助手,实现对PC端、手机端各类应用软件的“你说PC做”,全面开启智能体时代。 10月,OpenAI投资RPA初创企业Induced AI,其“RPA 3.0”产品基于大语言模型,通过英语描述与录屏视频转化为伪代码,实现工作流程自动化。随着AI Agent兴起及执行能力短板暴露,OpenAI的深意逐渐显现:结合RPA强化Agent能力,打造企业级Agent。 12月,清华与智谱AI发布CogAgent- Chat,基于视觉语言模型的GUI智能体,引领GUI理解技术发展。腾讯等大厂也在Agent与RPA结合领域积极布局,如腾讯的AppAgent项目,展现了巨大潜力。 这些创新实践均展示了Agent与RPA技术的完美结合与广阔应用前景。 于是,LLM厂商、科研机构及科技大厂对Agent与RPA的结合进行了深入研究,突显RPA在AI Agent应用中的关键作用。 ToB场景,AI Agent或等于RPA AgentAI Agent在体验上优于直接使用LLM,具备高智能和普适性,但存在效果不稳定和生态融合度不足的问题。 OpenAI提出的“LLM+记忆+规划+工具使用”框架中,工具使用是执行任务的关键。RPA在工具调用方面发挥重要作用,与API结合,实现智能自动化的全面能力。 因此,组织重新关注RPA,构建自动化流程的长期维护机制成为新课题,而拥有丰富数据、经验、技术及生态能力的RPA厂商推出的Agent产品备受关注。 RPA Agent,即以RPA为核心的AI Agent,正逐渐成为行业焦点。 现有Agent产品多停留在问答层面,少数能通过API操作工具或适用于内部生态,与理想智能体存在差距。它们在内容生成等方面表现出色,但在执行层面力不从心,难以支持复杂业务流程的自动化执行。 RPA Agent恰好弥补这些不足,具备操作大型企业复杂业务流程的优势。已采用RPA的企业可轻松享受Agent红利,仅需将原有解决方案升级为Agent解决方案。厂商常提供技术平移及迭代服务,避免企业再次投入。 Agent解决方案多基于企业原有RPA系统制定,调用RPA执行管理软件操作。率先推出基于RPA的Agent解决方案的厂商占据优势,因其对RPA和超自动化有深刻理解。 AI Agent在B端落地,还需要考虑很多AI智能体在B端落地需考虑安全性、技术发展周期成熟度及与To B场景的契合度。 以金融领域为例,复杂业务流程自动化构建需结合数据库读取、API管理及UI自动化连接。RPA Agent基于LLM并兼顾API与UI自动化,成为可行解决方案。 RPA模式在数据安全方面优于API模式,采用无侵入方式操作,结合ISSUT(实在智能首发的屏幕语义理解技术)模仿人类行为。减少软件暴露的API数量,遵循设计原则,降低安全风险。 因此,RPA Agent成为LLM时代企业应用Agent的新范式,具备高效执行能力和广泛适用性,是企业实现智能化、自动化的关键工具。 无限超人(InfinitMan)以打造大数据平台为目标,致力于提供大数据软件与行业解决方案。作为一站式大数据及AI智能应用服务商,专注于大数据及人工智能技术的产品研发和应用,基于云计算和大数据技术,为全球范围内中小型企业提供数据获取能力、数据分析能力和行业场景化解决方案。赋能用户,帮助用户降低成本、提升效率、增强业务及竞争能力。 |
|