几个概念: AI智能体和AI代理, 深度搜索和深度研究, 还有MCP

邸彦强 2025-03-17 发布于河北

展开全文

先前写点什么东西都是为了蹭热度, 但是高估了自己写东西的速度, 结果热度没蹭上, 化费不少时间写出来的东西也没什么人看 :(. 所以这回点简单点的, 就想梳理几个比较混淆的概念.

1. AI Agent vs. Agentic AI [1]

AI Agent通常翻译成AI智能体, 而Agentic AI翻译成AI代理. 在不少的文章中, 这两者经常被认为是同一个东西, 或者AI智能体是和AI代理的一种特殊形式, 但实际上两者是是有区别的.

AI代理. AI代理中的agentic这个词主要是为了描述系统的一个特性: 自主性. 系统可以自己观察环境, 利用已有的知识做出决策，采取行动以取得目标, 有时候它甚至会自主学习. 按照文章[1]中的描述, AI代理通常会有四个关键步骤:

● 感知: 从所处理的世界或者环境获取用于做决策的背景信息.

● 推理: DeepSeek R1模型的出现大家已经比较清楚推理 (reasoning) 的意思, 简单来说就是通过模型生成解决一个问题所需要的步骤和或者思路, 同时模型还具有反思以后重新生成的能力.

● 行动: 推理完成以后知道该做什么动作 , 实际的执行过程被称为是行动.

● 学习: 通过接收的反馈具有自动升级迭代的功能.

简单而之: AI代理它特指具有自主性和决策能力的人工智能系统, 不管它的形式是不是工智能体.

AI智能体. 在有些陈述中, 智能体也会被定义为是具有自主性、感知能力和决策能力的实体. 但实际上现在用智能体去解决一个具体任务时, 解题思路往往不是智能体自主决策的，而是由人来预测规划好的. 有些智能体用于实现一个预先定好的工作流程, 有些智能体则是基于人工标注数据来任务规划 (planning)，本质上还是人来做规划和推理的工作, 泛化能力比较有限。但是...

OpenAI O系统模型和DeepSeek R1这些推理模型兴起以后, 大家都想着怎么把推理模型嵌入到智能体系统中, 以推理模型为引擎, 让智能体也具备推理和反思等能力. 下面要介绍到的Deep Research也是一个智能体 (是Open AI公开的第二个智能体), 其中使用了OpenAI o3模型作为引擎, 它具有很强的自主性. 这种智能体可以被称为是Agentic系统.

2. 深度搜索和深度研究

深度研究 (Deep Research) 是由OpenAI提出的智能体系统[2], 目标是辅助研究人员开展科学研究. 系统包含两个功能模块: 1) 对大量数据, 主要是互联网数据进行深度搜索, 2) 基于搜索的内容进行长文本生成 (生成技术报告). 所以可以看到, 深度搜索 (Deep Search) 是深度研究的一个功能模块, 当然它是最核心的模块之一. 深度搜索的关注点是如何为一个复杂问题去寻找足够多高质量的搜索内容. 很多文章将深度研究和深度搜索当作是同一个概念, 但我个人理解两者还是有明显区别的, 理由是长文本生成 (例如生成技术报告或者专利) 依靠单一的模型大概率是做不好, 需要依靠多智体系统, 用多个模型来逐步生成. 只有深度搜索解决不了长篇文本生成的问题.

深度研究: 前文提到, 深度研究最开始是由OpenAI提出来的一个智能体, 底层用了o3模型做推理引擎, 然后用了多个模型做长文本生成 (从Open AI Deep Research消耗的tokens数可以猜测到它不是用单一模型解决问题的). 除了OpenAI以外, Google和Perplexity也有类似的Deep Research产品.

深度搜索: 深度搜索其实和Agentic RAG非常相似的两个东西 (或者说是一个东西?), 都是通过模型自主决策来决定搜索的过程. 深度搜索有不少开源项目, 例如Deep-Searcher[4], R1-Reasoning-RAG[5], 以及UltraRAG中的Adaptive Note[6]都属于这个方向的项目.

关于深度研究和深度搜索的产品以及开源项目, 这里有一个效果对比测试[7]. 这个测试对比没有区分深度研究和深度搜索的, 全部放在一起做对比.