深度剖析 / 检索与 RAG

检索与 RAG

检索增强生成的进阶——高级架构、图 RAG、把检索作为智能体工具、RAG 安全。

  1. 进阶 RAG 架构
    朴素→模块化→智能体式 RAG 谱系与关键杠杆——CRAG、Self-RAG、查询变换、融合、重排序——全都在攻击同一个“垃圾进、自信错出”的失败。
  2. GraphRAG 与多跳检索
    为什么扁平 top-k RAG 回答不了主题型或关系型多跳查询,微软 GraphRAG 与迭代检索-推理循环如何解决,以及何时不该用的成本/陈旧化启发式。
  3. 混合检索与重排序
    为什么单一检索器在结构上不够、跨 BM25 + 稠密的倒数排名融合、"检索-再交叉编码器"两阶段模式,以及交叉编码器太慢时 ColBERT 式晚交互的位置。
  4. 文档解析与摄取质量
    摄取是不被仪表盘照亮、却决定答案是否曾可被索引的那半 RAG——布局感知解析、表格、OCR、结构化分块,以及作为解析逃生阀的视觉 RAG。
  5. 查询理解与变换
    在搜索之前先修好问题——改写、分解、多查询、HyDE 告诫、退一步提示、以及路由——给 RAG 流水线加智能最便宜的地方。
  6. 智能体式检索:把搜索做成工具
    把检索做成模型在 ReAct 式循环中迭代调用的工具,带预算、停止判据,以及把方向盘交给模型后随之而来的新失败模式(原地循环、漂移、过早停止)。
  7. 评估 RAG
    把检索、接地与答案质量当作三件独立的事来打分——recall@k、忠实性、答案相关性——加上如何构建一个持续生长的小评测集,以及在不自欺欺人前提下使用 LLM 裁判。
  8. 选向量数据库
    一份约束优先的选型指南——向量库到底是什么、产品之间真正不同的那些轴(ANN 算法、过滤质量、新鲜度、混合检索、多租户、运维、成本)、读懂厂商话术所需的最少 HNSW/IVF/DiskANN 内部知识,以及为何多数团队最终落在 pgvector。