2026-04-23#

Data: 2026-04-23 23:07:16

今天的任务，是搞清楚怎么用 SaaS 模板，然后 4.30 左右发布第一版！！！之后就致力于搞这一个站了，顶多加上 owz 。其实也是一体的，ADHD 应该还是蓝海。

今天介绍 9 种 RAG（AI 检索增强）技术

因为 AI 本身有知识截止日期，如果裸机运行，很容易产生幻觉，因此我们需要给 AI 一个档案馆、图书馆，让它能查资料。这既是 RAG。

这个在我们开发 AI agent 时很常用，尤其在 AI 客服方面、员工助手、知识保护（防止 AI 和爬虫白嫖我们的脑力成果）。

第一种：Naive RAG（基础 RAG）

把文档切成小块（比如 500 字），然后转化成向量，存入向量数据库。用户查询时，也把问题转化成向量，之后检索，让 LLM 处理后返回。

第二种：Semantic Chunking（语义分块）

在 Naive RAG 里，如果 500 字为一块儿，那容易把关键内容截断，语义分块是指先把文档按句子拆开，计算相邻句子的相似度，该度下降，话题变了，在这个地方拆分。

第三种：Parent-Child Retrieval（父子级检索）

可切块有个矛盾，切小了检索精准但上下文不足，切大了上下文足但噪声多。

父子级检索是先把文档切成大块，再把大块细分成小块。检索时用小块精确匹配，命中后返回它所属的大块，保证检索精度又提供完整上下文。

第四种：Hybrid Search（混合检索）

但是！纯向量检索不擅长精确术语匹配，比如搜"ERROR_CODE_4012"这种编码，找不到精确结果。

混合检索同时使用向量搜索和关键词搜索（如BM25），向量负责语义理解，关键词负责精确匹配，通过RRF算法合并两边结果，适合术语密集的领域。

第五种：Reranking（重排序）

可检索回来的文档里总会混有噪声。Reranking是在检索和生成之间加一个精排步骤，用Reranker模型给每对（问题，文档）重新打分。

一般采用分层筛选，先用粗检索召回150个，再用轻量Reranker筛到20个，最后用Cross-Encoder精排出Top 5，平衡召回率和计算成本。

第六种：Agentic RAG（智能体 RAG）

不同场景需要不同的检索方式，有的查向量库，有的查数据库，有的搜网络对吧。

Agentic RAG 让 AI Agent 自主决策，配备一组检索工具，Agent根据问题自动选择合适的工具，看结果够不够，不够就换方式再搜，直到信息足够生成答案，非常灵活。

第七种：Corrective RAG（纠偏式 RAG）

有个问题，Agentic 搜到的资料可能质量不好，如果大模型硬着头皮用这些内容回答，就会胡说八道。

Corrective RAG 在检索和生成之间加个质检员，逐个审查检索到的文档是否相关。打分高的直接用，打分低的回退到 Web 搜索兜底，打分模糊的就合并结果，避免基于垃圾信息生成答案。

第八种：Self-RAG（自修正 RAG）

大模型可能拿到正确资料但回答时夹带私货，产生幻觉。这… 怎么搞？

Self-RAG 在整个流程设置四个检查点让模型自我审视：这个问题需要检索吗？检索到的文档相关吗？我的回答有文档支撑吗？这个答案对用户有用吗？通过多次自我验证，提高答案的准确性和可靠性。

第九种：Text-to-SQL RAG（文本转 SQL RAG）

如果数据是结构化表格（如销售数据、财务报表），向量检索效率很低。

Text-to-SQL RAG让大模型把自然语言问题直接翻译成SQL语句，执行查询后把结果作为上下文生成回答。适合所有数据分析类需求，但生产环境必须配备权限控制和SQL审计，防止注入攻击。

Naive RAG - 所有方案的基础，必须理解

语义分块（Semantic Chunking） - 解决切块质量问题，影响后续所有环节

层级索引（Parent-Child Retrieval） - 解决检索粒度矛盾，应用广泛

检索增强层（2个） Hybrid Search 混合检索 - 生产环境标配，几乎所有场景都建议使用

Reranking 精排 - 大幅提升检索质量，成本效益比高

质量控制层（2个） Corrective RAG（CRAG） - 增加质检环节，提升系统可靠性

Self-RAG - 避免 AI 幻觉，保证答案质量

高级应用层（2个） Agentic RAG - 当前主流生产范式，灵活且强大

Text-to-SQL RAG - 结构化数据分析必备，应用场景多

- end -#