深度剖析 / 检索与 RAG

检索与 RAG

检索增强生成的进阶——高级架构、图 RAG、把检索作为智能体工具、RAG 安全。

进阶 RAG 架构

朴素→模块化→智能体式 RAG 谱系与关键杠杆——CRAG、Self-RAG、查询变换、融合、重排序——全都在攻击同一个“垃圾进、自信错出”的失败。
GraphRAG 与多跳检索

为什么扁平 top-k RAG 回答不了主题型或关系型多跳查询，微软 GraphRAG 与迭代检索-推理循环如何解决，以及何时不该用的成本/陈旧化启发式。
混合检索与重排序

为什么单一检索器在结构上不够、跨 BM25 + 稠密的倒数排名融合、"检索-再交叉编码器"两阶段模式，以及交叉编码器太慢时 ColBERT 式晚交互的位置。
文档解析与摄取质量

摄取是不被仪表盘照亮、却决定答案是否曾可被索引的那半 RAG——布局感知解析、表格、OCR、结构化分块，以及作为解析逃生阀的视觉 RAG。
查询理解与变换

在搜索之前先修好问题——改写、分解、多查询、HyDE 告诫、退一步提示、以及路由——给 RAG 流水线加智能最便宜的地方。
智能体式检索：把搜索做成工具

把检索做成模型在 ReAct 式循环中迭代调用的工具，带预算、停止判据，以及把方向盘交给模型后随之而来的新失败模式（原地循环、漂移、过早停止）。
评估 RAG

把检索、接地与答案质量当作三件独立的事来打分——recall@k、忠实性、答案相关性——加上如何构建一个持续生长的小评测集，以及在不自欺欺人前提下使用 LLM 裁判。
选向量数据库

一份约束优先的选型指南——向量库到底是什么、产品之间真正不同的那些轴（ANN 算法、过滤质量、新鲜度、混合检索、多租户、运维、成本）、读懂厂商话术所需的最少 HNSW/IVF/DiskANN 内部知识，以及为何多数团队最终落在 pgvector。