虽然GPTs推出后暴露了很多问题,时不时就会有安全组织现身说法,却无法阻挡人们创建专属CahtGPT的热情。 因为宫斗,OpenAI不得不将GPT Store的上线推迟到2024年,这就让一些第三方GPT Store的声望更强,GPTs Hunter数据显示目前的GPTs数量已经达到3.3W+。 按照这个发展速度,就是OpenAI官方GPT Store在明年1月1日上线,GPTs的数量最少也能超过10W+。如果算上企业用户借助微软OpenAI服务开发的GPTs,这个数量可能要翻倍。 微软属于近水楼台,紧跟着OpenAI推出的Copilot Studio功能更强且应用更广,已经支持自定义ChatGPT助手无缝集成在CRM、ERP、OA等日常办公系统中,安全性能也更强。 这还只是OpenAI一家厂商的GPTs产品,其他厂商的同类产品已经在路上或者发布。 比如国内大语言模型(LLM,Large Language Models)厂商昆仑万维发布的天工SkyAgents平台,可以让用户通过自然语言构建私人助理。字节跳动的豆包平台,也悄悄上线了创建AI智能体功能。在这个两个平台,都能构建类GPTs产品,当然也能深度集成各自生态内的办公等产品。 开源厂商也不例外。比如LangChain推出的开源项目OpenGPTs,能让用户构建类GPTs产品。 “准Agent”GPTs作为AI智能体的早期产品,它的大量出现必然会带来LLM在更多场景的大量应用,也为真正AI智能体的应用做了铺垫,先一步引领了用户体验并教育了整个市场。 用比尔盖茨的话来说,Agent将能够帮助人们处理几乎所有活动和生活各个领域的事务,对软件业和整个社会都将产生深远影响。 GPTs是AI智能体时代的前夜,它的大量应用意味着自主智能体时代即将到来。 未来AI智能体的普及应用,将会造就一个极其庞大的市场。大模型厂商、技术供应商、企业服务软件厂商、初创企业以及各领域的大型企业,都将参与到这场AI智能体的饕餮盛宴。 那么,未来的AI智能市场规模会有多大?市场格局又是怎样的?目前都有哪些具有代表性的Agent产品及项目? 本文,王吉伟频道通过七张图来为大家揭开这些谜题。如果你是AI Agent创业者,这篇文章将非常适合你。 AI Agent市场前景 先来看一下AI Agent的市场前景。 单从自主智能体(Autonomous Agent)市场规模来看,marketsandmarkets数据显示2019年全球自主智能体市场规模为3.45亿美元,预计到2024年将达到29.92亿美元,2019-2024期间的年复合增长率将达到54%。 其中,自动化和敏捷性的提高、交付增强客户体验的需求、成本节约和投资回报的增加是自主智能体行业的一些主要增长因素 同时该机构预计,2023年全球自主人工智能和自主智能体(Autonomous Agent)市场的收入规模超过48亿美元,到2028年有望达到285亿美元左右,预计2023-2028年的年复合增长率为43.0%。 自主人工智能和智能体的扩张受到多重因素的推动,包括人工智能应用的日益普及、并行计算资源的可访问性的提高,以及自动驾驶和医疗保健的进步。 grandviewresearch预测数据与此相当。其数据显示,2022年,全球自主人工智能和自主智能体市场规模为39.3亿美元,预计从2023年到2030年将以42.8%的复合年增长率(CAGR)增长,其中亚太地区的复合年增长率将高达46.2%。 “自主(autonomous)”或“自动驾驶(self-driving)”术语用于描述无需人工干预即可独立操作和做出决策的人工智能系统。自主智能体产品形态主要体现于虚拟助手,包括亚马逊的Alexa、苹果的Siri和谷歌的Assistant等。 这意味着,大量Agent将会以软件助手的形态出现,同时原有软件形态的助手类产品也会升级迭代为自主智能体。 该机构特别提到,软件市场在2022年已经以超过42.0%的收入份额领先市场。由于系统随着时间的推移而发展,适应环境并从中学习,软件市场正在迅速增长。 需要说明的是,这几组数据主要预测的是自主智能体的市场。虽然未来的AI智能体市场会以自主智能体为主,但不同企业往往会因为业务属性与市场目标的不同,在具体需求上不一定都是自主智能体,还会涉及到非自主智能体以及生成式智能体等多种形式。 再就是某些引入Agent架构的传统软件产品,不一定会以智能体的形式出现。 因此,AI Agent的未来的市场空间实际要大得多。 自主智能体是一种软件或程序,不需要人工干预就能为用户或系统做事情或做出决策。自主智能体的设计目的,是在与环境或其他自主智能体交互的同时完成特定的任务或目标。 例如,聊天机器人是自助服务智能体,可以通过文本或语音与用户交流,响应查询,提供数据,甚至完成诸如安排约会或订购产品之类的任务。 另一个例子是,2023年3月美国软件公司Adept筹集了3.5亿美元,用于开发数字助理,这是一个能够将文本命令转换为一系列动作的人工智能模型。 对于AI Agent的未来,Octane AI 联合创始人Ben Parr认为,Agent不仅在科技领域更是整个商业领域的浪潮,他预测10年内,将有多家价值数十亿美元的公司的运营完全交给自主智能体。 事实上,从现在出现的少数人力资源+AI Agent的公司,已经能看到AI智能体往这个方向的发展苗头。这个话题不是本文的重点,王吉伟频道会在另一篇文章中与大家探讨。 AI智能体市场格局 对于自主智能体这个新兴领域,资本市场已经用其独到的投资眼光将AI智能体产业划分为三层架构。 大家可以看下面这张来自风险投资公司Aura Ventures的《自主人工智能体新兴市场格局》图(成图于7月之前),它将整个Agent产业自下而上划分三层,最下面为用于智能体运营(AgentOps)的模块插件层,中间为程序应用层(APPlications),最上面为服务层(services)。 可以明显感受到,智能体运营层借鉴了OpenAI官方给出的AI Agent架构,该架构也是当前最为流行的Agent架构之一。 智能体运营层 智能体运营层主要分为七个部分,分别为智能(Intelligence)、记忆内存(Memory)、工具和插件(Tools and plugins)、多智能体游乐场和协议(Multi-agent playgrounds and protocols)、多智能体通信模式(Multi-agent communication schemas)以及多智能体通信模式、监控、安全和预算(Monitoring,security and budgetary)及智能体运营市场(AgentOps marketplace)。 智能(Intelligence):智能体的“大脑”,由负责任务创建、规划和上下文的 LLM 提供支持。它们理解并产生自然语言,拥有广阔的世界知识,并且能够学习,LLM一般通过 API或开源被使用。 OpenAI的GPT、Claude等LLM都在这个部分,更先进的例子包括 HuggingGPT及Falcon 等。其中也包括特定领域的LLM和DAAS,比如为心理健康数据提供API的Sahha 。 分销优势、成本、社区护城河和模型质量,将是这个部分的制胜关键。 记忆内存(Memory):获取、存储、保留和检索数据。分为短期记忆、长期记忆和感觉记忆。向量数据库和嵌入框架的激增是其中的关键。参与者包括 Pinecone 和 Chroma以及像Perplexity AI一样具有集成优势的Text to SQL 初创公司, 工具和插件(Tools and plugins):能够提供工具与插件的市场、API和技能库,用于创建、修改和利用外部对象来执行超出LLM 限制的事情。外部工具可以显著扩展模型功能,例如浏览器扫描和桌面支持等。目前,这些实用程序主要存在于提示和技能库中。 典型的产品,如Openai插件、replit及toolformer等。其他如SLAPA是一个自学习的API 系统,是早期产品化应用案例。Relevance AI也是该领域另一个快速发展的参与者,它在 UX 和“用低代码轻松创建智能体链”的能力方面颇具优势。 多智能体游乐场和协议(Multi-agent playgrounds and protocols):智能体网络之间应该应用什么通信协议,该问题将在这部分得到解答。PumaMart和SIM Gen Agents一直在做这方面的攻关,E2B是这个领域的新兴参与者。E2B已与OpenAI等LLM厂商建立合作,其Playgrounds沙盒环境可以让用户构建各种基于LLM的智能体及相关应用。 多智能体通信模式(Multi-agent communication schemas):由AgentOps的混合组成的Agent,将需要能够使它们以尽可能最佳的方式进行交互的服务。多智能体通信协议,更有益于多智能体学习、反思和解释的概念。 目前这些主要作为提示技术存在,更多是在论文中提及,比如Chain of Thoughts prompting Wei et al (2022) 和 Reflexion (Shinn & Labash 2023)(回复 格局 ,获取本文所用所有大图资料)。 这一部分,主要提供思维链、自我询问,cmol调试器子目标以及分解相关。这个细分市场,也会在接下来迎来一些玩家。 监控、安全和预算(Monitoring,security and budgetary):在智能、内存、工具和插件、通信和协议、安全和安保方面,Agent都应受到监管。目前而言,对于工具级别或智能体级别的AI进行监控,仍然是一个悬而未决的问题。 这是Agent商业落地最重要的部分,能够通过跨多个平台的监控(错误的数据沿袭)、安全性和预算来优化智能体的玩家将会胜出,也会催生很多智能体安全相关的初创项目。 智能体运营市场:被定义为智能体框架产品发布平台,如FinGPT,BabyAGI,AutoAGI,CAMEL等都在这一层。HuggingFace和Github也被放在这一层,主要因为这两个平台提供并托管了大量的模型和相关项目。 HuggingFace是模型分发的主要参与者,有机会为Agent创建一个类似市场的产品,就像Smol-ai Developer所做的,AI工程师可以轻松地为任务选择最佳的Agent基础设施。 Agent应用程序层 Agent应用程序层主要包括通用应用(General purpose)和行业应用(Business industry)两部分。 通用应用(General purpose):这些Agent提供了前所未有的数据驱动智能水平,并为个人用户实现智能应用的民主化。这些将围绕“待完成的工作”框架展开。病毒式传播、建立分销优势的能力,以及利用更多可抵御大型科技公司的“利基”用例将是获胜的关键。 目前主要案例是个人编程类工具,如 GitWit、GPT-Engineer等, Embra AI(MAC个人助理)、Dust(生产力助手)等个人生产力领域的项目数量也在不断增长。 行业应用(Business industry):垂直领域的Agent,比如用于编程、营销、辅导及研究人员等的智能体,使用特定于上下文的业务规则或数据进行微调,可以有效降低成本和提高绩效。 预计进入AgentOps的行业下游参与者将在这个市场中占据优势,其技术堆栈更具防御性。当然,敏捷构建的现有企业也有可能获胜。 关于应用层的其他Agent产品,大家可以按图索骥,这里不再赘述。 services服务层 services服务层包括用户构建自己的智能体(Build your own-deployment)、智能体市场(Agent marketplace)和多智能体监控(Multi-Agent monitoring)三部分。 构建专属个性化智能体(Build your own-deployment):大量厂商正在涌入这个领域,目前主要是低代码或无代码平台包括RPA等超自动化平台。这些厂商在原有产品基础上构建的基于LLM的平台,可以使任何企业或消费者用户都能够轻松创建和部署智能体。 为实现差异化、用户体验、客户支持以及针对特定领域的(例如,B2B、B2C、行业)定制可用性能力,将是厂商们获胜的关键。 值得一提的是,这些平台的一个关键销售参数是客户保留,而集成和用户体验(例如支持)将是提高用户粘性的关键。这部分的参与者包括 Relevance AI、XpressAI、SuperAgentAI 和 AgentRunnerAI等。 智能体市场(Agent marketplace):随着市场形势的爆炸式增长,应用程序将在市场上上市进行推广,将会出现更多为特定任务“雇佣”预先训练的应用程序的平台,不管是在B2C领域还是B2B领域。 现有的此类产品中,如GitHub和Fiverr开始扮演这个角色。NexusGPT 正在通过自由智能体市场和MindOS 来颠覆这一点,已经具备广泛关注度。未来,我们可能会看到特定行业或功能领域的“捆绑”或大批人工智能工人作为产品出售。 多智能体监控(Multi-Agent monitoring):多智能体的控制室引擎是一个即将被颠覆的新兴开放类别,企业和个人级别都有用例。这个领域的企业,采用更简单的方式构建集成和API的能力将是其获胜的关键。 目前该领域尚处于萌芽阶段,但也有适用于企业和个人的项目,如 Alphakit.AI 是这一领域的先行者,已经实现通过手机监控个人Agent。 需要说明的是,这张图绘制于7月份之前,所以大家要注意并不是现在只有这些Agent相关产品及架构。最近4个多月里又出现了大量的Agent,并且有了OpenAI的Assistant API这样的工具,传统AI厂商想要构建Agent应用也是相当简单。 包括国内也出现了很多Agent项目,前段时间奇绩论坛的一场路演据说有30+Agent项目,这预示着AI Agent即将进入井喷期。 所以这张Agents市场格局图并不是用来看有哪些产品的,主要是为了让大家熟悉Agent产业结构。这样要创业的话就能找到自己的位置,清楚自己的项目处于哪个层次,并能够了解国外有哪些对标产品。 AI Agent SDK、框架与库 前面提到现在已发展出很多Agent架构,下面我们也通过一张图来了解。 目前在智能体的构建上,开发人员为解决可靠性、标准化、数据安全等问题而选择的范式各不相同。 目前的智能体要么建立在现有工具之上,要么创建自己的内部解决方案,要么采用一些专门为智能体构建的产品,其中许多仍处于早期阶段或 alpha/beta 版本。 一些开发人员,为传统软件中智能体问题的等效问题提供了解决方案,比如:
传统的软件解决方案仍然无法应对LLM性质所带来的特定于智能体的挑战。一个例子是调试智能体,它本质上是在处理提示,并且缺少与实时调试等效的智能体。 更多开发人员在构建智能体时,会使用新的框架和SDK来重新发明轮子,而不是在现有技术之上进行构建。 所以,现在的一些厂商完全摒弃传统软件构建智能替代逻辑,有的正在构建完全自定义的基础设施,有的则使用现有技术至少以某种方式适合他们的智能体案例。 其中一种理念是多智能体系统的基础设施补充,应该是面向智能体的智能体专有云,如E2B 为智能体或 AI 应用程序构建的AI playground、沙盒云环境,这些环境对于智能体的编码案例很有用。 还有更多为AI 智能体或 LLM 应用程序量身定制的项目,最常见的是用于构建、监控和分析的框架。这些构建AI Agent产品所需要的特定SDK和框架,见下图。 这张图展示了目前已有的用于创建、监控、调试和部署AI Agent产品的SDK、框架、库和工具的数据库。 按照不同作用及功能,将这些框架及工具分为九个部分:监控、可观察性及分析(Monitoring、Observability、Analytics),前端(Frontend),大语言模型运行时(Runtime for LLMs),构建框架和平台(Building Frameworks platforms),数据集成与内存管理(Data integration,Memory management),大语言模型API和路由器(API and routers for LLMs),人工智能产品构建库(Libraries for building Al products),编排(Orchestration),构建和部署LLM(Building&deploying LLMs)。 其中在构建框架和平台中,我们看到了OpenAI的Assistants API、Langchain、AutoGen、OpenGPTs、Hugging Face Agents等知名Agent构建框架。 有意思的是,GPTs与Assistants API推出后,被网友认为已死的Langchain及其推出的全新框架OpenGPTs都在其中,这也间接证明了Langchain的生命周期并没有传言那么惨。 在王吉伟频道看来,对于创业者而言,这张图算是点明了Agent技术发展路线。想要打造AI Agent的团队,可以根据该图来选择其产品需要的框架及相关组件,或者寻找相应的替代品,不用再去为选择什么框架与技术而大费周章。 开源Agent和闭源Agent E2B出品的这份AI Agent行业全景图,所涉及的项目不算是最全的,却是比较完整的,目前所涉及的行业及领域都有相应的代表性产品。 该图把目前的Agent产品分为开源和闭源两个部分,并将按照项目属性及面向用户群体将这些产品放到了不同领域及行业,其中还涉及到了Agent构建架构及运营支持的部门。 它被E2B放在名为awesome-ai-agents的GitHub项目上,此项目是开放性的,创业者可以在GitHub页面提交相关项目。 这张图一直在持续更新,目前已经更新11月的2.2版本。新版本与上一个版本的最大区别是,加入了「智能体运行时」单元。 可能是登上这张图的项目过滤标准较高,也可能是迭代速度跟不上项目提交速度。目前图片上的智能体相关项目(包括智能体构建框架及运行支持,云平台除外)为98个,但项目页面提交的项目展示数量已经超过130个。 从图片来看,编程类Agent项目最多,整体数量已经达到38个,其中开源项目18个。 Agent构建框架类项目数量仅次于编码类的Agent,总数量为19,开源项目为16个,闭源项目3个,其中包括OpenAI Assistans API。 生产力类Agent以闭源项目居多,数量为13,开源项目3个。 通用型Agent数量为12个,其中开源项目要多一些,数量为8。 数据分析类的Agent总共6个,其中闭源项目4个。 而3个商业智能类Agent,都是闭源项目。 科学、研究、设计、市场营销类的Agent的数量各为1个,其中只有科学类和研究类Agent为开源项目。从中可以看出,垂直领域类的Agent目前数量很少,也就意味着比较广阔的市场,创业的话可以往相关的方向走。 当然,还有很多Agent项目这里并没有放上,另外各领域的传统企业管理软件也正在发力Agent,AI智能体的列表必然会越来越长。 后记:个人智能体时代即将到来 下面这张图,来自风险投资机构madrona在6月份发布的一篇关于AI Agnet的博文。 这张图很简单,罗列了当时比较具有代表性的生成式AI应用。其实用现在的眼光来看,这些应用当时正在向Agent模式过渡。尤其是智能助手类工具,几乎都在谋求向Agent的转型。 最近比尔盖茨关于AI Agent的文章《AI is about to completely change how you use computers》刷了屏,详细阐述了Agent将如何在未来几年颠覆软件行业。 其实在4月份高盛(Goldman Sachs)和SV Angel举办的关于人工智能的活动中他就提到过,未来的人工智能顶级公司可能会创建一个个人数字智能体,可以为人们执行某些任务。 或许正是受此启发,madrona这篇博文名为《A Wave of Personal Agents is Coming》,谈的是正在到来的个人智能体时代。 该图按照个人应用工作流,将相关的工具与应用分为增强(ENHANCED)和原生(NATIVE)两个板块。增强板块列举了当时非常接近于Agent的应用,主体部分原生板块分为内容创作及个人智能体&聊天助手两部分。 在内容创作部分,红杉将其分为视频/图片、市场营销图片、写作、幻灯片、额外内容创建及3D游戏开发几个子版块,每个版块都列举了相应的应用。 个人智能体&聊天助手部分是按照行业应用划分的,分为购物、外卖/即时订餐、家居、房地产、餐厅订位、横向聊天助手、个人生产力、旅行、人工智能朋友/伙伴、健康和教练及教育等行业。 其中前六个都标注了开放机会,并且第六个用T.B.D.标注,意味着在更多行业及领域都会有更多的相关的产品走出来。 这张图会绘制于6月份,所列举的应用还是生成式AI应用或者可以用“准Agent”来表达,现在看来有些产品甚至可以被OpenAI的GPTs替代掉。 图片左边的被红杉称作增强型应用的产品,在当时已经很接近智能体功能,但还不具备自主采取行动的能力。比如Expedia在其移动应用程序中实施了AI聊天搜索用于发现行程,Kayak、Instacart和Klarna等公司在ChatGPT 中都有插件。 现在,随着OpenAI推出Assitant API以及更多Agent架构的出现,这些产品应该正在或者已经快速向Agent对齐。当时madrona调研的一些创业团队,已经从特定领域的方法开始构建Agent,还有些团队采用横向方法来创建个人智能体。 这张图片上列举的产品不是现在意义上的AI Agent,主要还是用于展示未来个人Agent的丰富应用场景,这也应该是其认为“一波个人智能体应用潮即将袭来”的主要缘由。 总体而言,这张图对未来Agent的产品分类和应用领域还是做了不错的梳理。同时这些产品都有机会用现在的新架构及新技术迭代升级成为Agent,拥有一定的参考与借鉴意义的。 也希望你的项目,能够早日进入类似的名单。 最后,欢迎对AI Agent感兴趣的朋友关注王吉伟频道,一起交流探讨AI智能体的创业创新及行业应用。 全文完 【王吉伟频道,关注AIGC与IoT,专注数字化转型、业务流程自动化与RPA,欢迎关注与交流。】 |
|
来自: 王吉伟频道 > 《AIGC与生成式AI》