Agent 需要 RAG 吗？

依旧延续周一 TGO 闭门会的分享思考，核心话题是：如何真正蒸馏一个人 + 如果完成了蒸馏动作，应该如何形成企业级 Agentic RAG 数据库类应用？

怎么说呢，现阶段为了适应 Agent 发展，模型本身已经往前走了很大一步，最核心的两个能力：

一个来自于模型本身，提供了百万级上下文窗口；
一个来源于工程能力优化，Skills 缓解了模型不稳定问题；

现阶段 Agent，在数据处理一块有了很大的进步，甚至说可以解决 80% 的问题（也就是数据正确率会在 80% 左右），于是现有经典架构就出来了：

上图是前些日子爆火的小龙虾 OpenClaw 的大概架构和解决的问题，如图所示，就可以前些日子各个老板所谓“养虾”是个什么意思，其实就是在梳理工作流/SOP。

在这个基础之下就衍生出来了同事.skill，大家想要用这个方式去蒸馏员工，我们只是从底层架构来说，就不太可能，但这里依旧有一些不错的衍生实践，比如 obsidian + Claudian 组合：

类似于 obsidian + Claudian这种模式都可以归类于Workspace Agent/知识工作区 Agent/文件系统型 Agent，他属于：

以私有工作空间为上下文，以文件系统为操作对象的协作型知识 Agent

这里最为核心的问题就产生了：过往，我们使用 RAG 去引入私有数据，而且 RAG 有很多复杂、烦躁的技术流程、而现在我们直接上传数据即可，效果貌似也挺好了，于是乎最本质的问题来了：

既然，Workspace Agent 效果这么好，是否 Agent 就不需要 RAG 了?

这背后涉及了两套完全不一样的 Agent 类型和技术范式：

协同 VS 高可信

从用户角度出发，Agent 对数据的使用可以分为两类：

第一类是协同类 Agent，典型代表是 AI Coding Agent，他需要使用者对 AI 输出内容具备良好的评价/判断能力，也就是说个人专业能力越强，那么这类 Agent 工具会用得越好；

第二类是知识输出（高可信）类 Agent，典型代表是垂直领域的应用如 AI 医生/AI 律师，他不需要你去协同，也不需要你具备专业评价能力，他只需要你被他引导，然后输出最正确的答案。

这里有两个核心差距：

第一是是否需要协同共创

第二是是否保证知识输出的正确性

比如 Claude/CodeX 这种都属于协同共创类 Agent，现在的主流技术架构是：Workspace Agent；

另一方面，一些复杂的行业应用（如 AI 医生）、AI 客服，都还是采用的第二套技术路径 Agent + RAG，只不过这里的 RAG 和大家以为的 RAG 会相去甚远，其复杂度会高非常多。

在这个基础上，我们再来聊聊Workspace Agent 与 Agent RAG的一些差异和应用场景：

协同：生产力工具属性

我们对于协同型 Agent 的核心假设是：使用者需要并具备评判能力，这里的意思是代码写得好不好，接下来怎么改，我们是门清的，AI 在这里的意义是杠杆作用，让我们做这件事的效率更高了。

因为是协作共创，所以他是允许错误的，于是对于数据的诉求是：广度和探索性。也就是他没办法给你唯一答案、甚至是稳定的正确答案，比如相同输入拿不到相同输出。

专家：替代的是判断本身

而严肃的 Agent RAG 面对的场景就很严苛了，比如 AI 医生/律师，这里的核心假设是：用户不需要也不应该具备专业能力判断，他们应该完全的相信 AI 的输出；

只要是严肃领域的 AI，毋庸置疑追求的一定是：精度和权威性。它要求的是 99.9% 以上的准确率，且每个结论都必须有据可查，能溯源到权威文档的具体章节，80% 的正确率在这里绝对不可接受的！

从实现上，高可信 Agent 追求的是：

可解释性，必须能准确指出结论来自哪份文档的哪一条，并且还要说清楚 CoT 是什么，这里可不是那种半吊子思维链，而是必须要符合行业逻辑的思维链

在这个基础上对数据的需求就会变得很苛刻，至于这里数据怎么做，就是各个行业的 KnowHow 与价值所在了。

综上，我们整个 Agent 架构选择的递进逻辑就出来了,场景决定需求 → 需求筛选范式 → 范式选择架构：

如果你是放大能力，选协同类，走 Workspace Agent 路线。
如果你是替代判断，选稳定输出类（高可信 Agent），走 Agentic RAG 路线。

接下来，我们再说两者差异导致的优劣问题：

优缺点

Workspace Agent 与 Agentic RAG 都具备使用私有数据的能力，但他们对待数据的态度就成了他们的核心差异：

Workspace Agent 把数据当成工作材料，重要的是协同；
Agentic RAG 把数据当成证据来源，重要的是 CoT；

工作材料或者证据来源的背后是数据严苛态度，其最终会表现为：技术便利性与数据成本：

你愿意为开箱即用付出什么代价，又愿意为高可信投入多少成本

便利性 > 正确性

Workspace Agent 的最大魅力，在于它几乎消解了数据接入的所有前置成本。

你不需要对私有数据进行复杂的预处理，不需要设计切片策略、不需要 TopK…

直接把文件拖进去，Agent 就能开始工作。这种上传即用的体验，是大家推崇他的原因。

但这份便利性的背后肯定是有代价的：它要求使用者本身具备评判能力。

也就是，从底层设计上 Workspace Agent 就追求的是便利性，他把数据准备成本转移到了使用者的判断力，用起来很方便的前提是，你得有本事接住它的输出

严肃性 >> 便利性

高可信 Agent 走的是完全相反的路径。它要求在数据进入系统之前，就完成严格的知识建模。

这可不是简单的切片和向量化，我在国外处理过程中有很多心得可供分享：

第一，知识库设计尤为关键，其中最难的是缺点边界与结构，所谓边界是你的AI系统到底要完成什么任务，必须穷举定死；所谓结构，就是知识要能匹配这套系统；

第二，知识梳理的时候要考虑逻辑关系链、要设计实体结构，要找到切入知识库的核心，比如用一个不重样的关键词将知识实体搜索出来，再根据实体结构的逻辑链找到各种关系，只要逻辑链清晰，提示词就好设计，AI就会聪明很多；

第三，在做知识库实体结构时，类型不要太多，如果产生层级，层级也不能太多，因为关系越多工程实现越复杂、层级越多知识库处理越复杂。做AI应用要平衡真实世界的模拟与数据工程实现的ROI，也就是如果工程实现复杂度过高，就要在数据复杂度层面做取舍；

第四，在前三点的基础下需要考虑的是架构实现问题，这里必须由一号位自己写文档做产品甚至是架构设计，不用你写代码，但你文档写完需要相当于伪代码写完了，不然下面产品和技术没那个能力做出来的。这里的架构设计核心是你的知识，如何让AI每次都能拿到、拿对、拿全、不拿多；

第五，在知识齐全的情况下，如何让AI聊得像个人是个封闭性问题，他的前提是知识是对的，如何像人一样表达这段知识，需要考虑什么，需要建模，或者说需要设计策略；

这套成本极高，且高度依赖行业 KnowHow。但一旦建成，它的收益也极其明确：输出可解释、可溯源、可审计。

对于不能容忍大概对的场景，这种前期投入是必须的，总结一下就是：高可信 RAG，将正确率的成本投入了前期的数据建设，所以就不需要用户有独立判断了。

二八逻辑

人有个特点，可以偷懒的话绝不会想要多动一下，所以这里就会有个问题：既然 Workspace Agent 做知识库表现已经很不错了，是不是 RAG 那一套就没用了？

额，可能还真不是那么回事，至少现在 Workspace Agent 更适用的场景是：个人工作空间。

在个人工作空间里面你想怎么玩就怎么玩，但一旦上 10 个人你再试试，大家会发现，相同的问题就一定有很多不同的理解，那到时候是听叶老师的还是听听王老师的呢？

所以，只要 Workspace Agent 想要去组织企业的知识库，那么会遭遇很多复杂的工程问题，那么也就失去了他的便利性了；类似的问题在 NoteBookLM 这种产品里面也会发生。

所以在企业视角来说，技术选择会更倾向于融合，是一种共生关系，这里跟我们之前做生产级 AI 客服的经验是温和的：80% 客户的问题会围绕着 20% 的场景不停做展开。

其实就算是严肃场景也是一样，最核心的流程使用高可信 Agent，其他 80% 非核心流程敞开聊，让 AI 自由发挥就好。

这种方式是比较兼顾知识有效性以及数据工程实现成本的方法，因为高可信 RAG 本质依赖的是行业 KnowHow 形成的核心 SOP/Workflow，与他配合的就是公司那套可信知识内核了。

这个可信知识内核，是企业真正有价值的资产，你要相信着不是一个路人甲员工能够提供的。

跟进一步，高可信不是一个产品形态而是一种风险分层策略。比如 AI 医生，其实也并不是所有任务都要求那么严苛，他只是在核心流程追求99.999%，比如：诊断、用药、治疗方案…

但其实还有些泛医疗场景包括，运动、饮食建议，其实是不会进入核心逻辑的，这里就会因为风险等级不一样而选择不一样的技术选型。

当然，具体到如何做，这里就展开了，总而言之，复杂度挺高的…

Agent 是否需要 RAG

写到这里，可以正面回答那个最本质的问题了：Agent 是否需要 RAG？

这里其实行业有相对成熟的案例：在 Coding Agent 这个最成熟的协同类 Agent 领域，传统 RAG 正在被主流产品集体抛弃。

Claude Code 官方提到过：他们早期版本也在用 RAG 但效果不好，取而代之的是一种 Agentic Search 的技术（也就是现在比较主流的技术），让模型自己玩，最后效果比 RAG 好多了…

这在之前 3 月份 Claude Code 代码泄露中有相关证据链，也就是我们是看不到 RAG 相关技术的痕迹的。

如果从这个角度看，传统 RAG 似乎确实不是 Agent 的必要组件。

但是大家要注意，按照我们之前的逻辑，这里的 Coding Agent 是协作型 Agent，他本来就不需要……

所以，如果只用这类的 Agent 去评判是有点不合理的，如果是高可信 Agent，RAG依旧是必须的，但是这个 RAG 的复杂度却不可同日而语。

两者的核心差异在于对检索这件事的目标和要求完全不同：

Agentic Search 追求的是探索效率和覆盖面，模型自己去走 ReAct循环，决定搜什么、读什么、要不要再搜一轮。

这套逻辑在处理代码、文档类材料型数据时非常高效，因为数据本身就是给人读的，上下文完整，逻辑自洽。

但高可信场景要的不是这个，它要的是每一次检索都必须拿到、拿对、拿全、不拿多。少拿一条关键证据，结论就可能出错；多拿一条无关信息，反而干扰模型判断，这不是 grep 加 glob 能解决的事。

所以，高可信 Agent场景下的 RAG，肯定不是检索，更确切的说法是知识工程，这里的难点或者工作量在搜索之前就决定了：边界在哪、实体结构如何设计、关系链要完整到什么程度、AI 代码工程如何与数据工程做结合……

综上，Agent 没有不需要 RAG 技术，只不是不需要之前那个 RAG 技术…

结语

回归一下，第二大脑如何做、到底怎么去蒸馏一个人、同事.skill的局限性在哪、他们各自到底在说什么？

我认为今天的内容是有一个不错的回答的：

同事.skill 有价值，但它蒸馏的是工作流，这种先做什么、后做什么属于之前数字化转型的延续，核心是吃掉重复工作，目标是降本增效；

要真的蒸馏一个人，这里的关注点就不是动作了，而是要去思考他为什么这么判断、怎么取舍、遇到异常如何决策。

这需要从 Workflow 再往上走一步，把判断标准、分类逻辑、案例边界等等全部考虑到位，这个就是我们之前说的高可信 Agent 依赖的数据工程了。

至于 Agent 需不需要 RAG，那是当然需要的，只不过又换了个名字罢了…

{{userData.name}}已认证

Agent 需要 RAG 吗？