-
Nexus:RAG 时代终结?编译器 AI 知识层来了
最近 Pinecone 发布了一个新东西:Nexus。最早我是在抖音上看到的,说实话,这种标题挺吓人的,低劣但有效,我都忍不住要点进去: RAG 时代终结了。 向量数据库不够用了。 Agent 需要 Knowledge Engine。 因为过去两年很多企业刚刚理解什么是 RAG,刚刚知道知识库不是把 PDF 丢给大模型,刚刚开始研究向量数据库、Embedding、Chunk、TopK、Rerank…- 1.7k
- 0
-
Vector Database(向量数据库):AI的”记忆宫殿”
一个让你脊背发凉的事实: 你每天在淘宝、抖音、豆瓣上的每一次"猜你喜欢"点击,都在帮一个数据库变得更聪明——而这个数据库存的,不是文字,是数字。 它叫向量数据库(Vector Database)。 一句话理解 向量数据库 = 专门存储"味道"(语义相似度)的数据库,让AI能快速找到和某个东西"最像"的其他东西。 它是怎么工作的 普通数据库…- 1.2k
- 0
-
向量库是RAG的前菜,知识图谱是答案,本体论是灵魂
在最初做RAG系统的时候有个几乎绑定的名词:向量库。所以他是什么呢? 应该说向量库是一个理论上很美好的名词,他是一类用于存储和检索向量的数据系统,这里有两点要注意: 向量(embedding),可以将一段文本、图片、音频等内容,通过embedding模型编码成一个高维数组; 检索,现在拿着一个查询向量,理想情况下向量库可以快速找到最相似的Top-K条类目,这里可以带上原文片段等信息; 所以,向量库…- 1.1k
- 0
-
【万字剖析】抛开 RAG 谈蒸馏.skill,大概率是形式主义
上周我拜访了前老板,他们应该是国内做 AI 应用最深的一批公司,相应着整个团队对 AI 的应用及理解都很到位,于是乎我问了他一个问题: 老板你觉得什么是 AI 原生团队/应用,对应着团队的组织结构会有什么变化吗? 说实话,因为打招呼做得太倡促,这并不是一个好问题,因为问的太大了(无论是与模型对话,还是与高端人士对话,问对问题都很关键),挺不好切入的... 然后对话在艰难的推进,过程中老板嫌无聊,还…- 1.2k
- 0
-
告别“伪智能”代码:用 Spec + RAG 打造真正懂你的AI程序员
引言:AI Coding 提升代码质量的关键 ——知识库的深度建设 在当前 AI Coding 快速普及的背景下,业界普遍面临一个核心矛盾:模型“能写” ≠ “写得对”。尤其在高频迭代、强业务耦合的场景中,代码的正确性、可维护性和一致性远比“能生成”更重要。 要突破这一瓶颈,关键在于让 AI 不仅“会写”,更要“懂上下文”——即深刻理解特定项目的技术契约、业务语义与工程惯例。为此,我们提出构建一…- 30
- 0
-
RAG:让AI先查资料再答题的聪明玩法
你有没有过这种经历——考试前把整本书都翻开了,结果看到一道题还是不知道该翻哪页? AI也有同样的困扰。 一句话理解 RAG = 先查资料,再回答——就像你考试时先看一遍书再答题,而不是裸考。 它是怎么工作的 想象你问AI:"特斯拉2024年的营收是多少?" 没有RAG的AI:就像一个记忆力超群但完全没看过特斯拉财报的书呆子。它会根据自己"听说过的知识"瞎编一…- 806
- 0
-
半年人工喂出来的AI客服:从0到1打磨生产级RAG系统,越用越聪明
之前我们说过23年是模型初年,主要行业主要着眼于模型,史称百模大战; 然后很快大家发现确实卷不动,于是开始冷静下来,找切实的落地场景,所以24年都在做应用,AI应用三巨头依次是:AIGC(窗口生成文案)、工作流AI、然后就是AI客服了。 而后25年在AI视觉这块需求变多、成熟的AI Coding异军突起,但复杂的AI客服依旧有很大的需求,AI客服这个也被认为是RAG类的应用,看上去简单,只不过很多…- 656
- 0












