前沿 AI 资讯(2026-01-12):RAG 进入 2.0 时代,重点不再是“能检索”
2026-01-12
RAG 已经从“接上向量库就能用”的阶段进入深水区:当你需要稳定地回答业务问题,最痛的往往不是检索算法,而是数据与流程。
RAG 2.0 的三个关键词:治理、引用、评测
- 数据治理:来源、版本、权限、更新频率、过期策略与删除链路。
- 引用可追溯:每个结论对应哪些片段、片段来自哪里、是否被改过。
- 评测闭环:召回率、命中率、回答正确率、引用一致性与成本。
工程趋势:重排与结构化上下文
只靠向量相似度召回,往往会带来“召回很多但不关键”的问题。更常见的组合是:
- 两段式检索:粗召回 + 重排(基于交叉编码、LLM 评分或规则混合)。
- 结构化拼接:把上下文按主题/来源分组,并附上时间与置信信息。
- 引用对齐:在生成时强制要求引用片段,降低无根据回答。
“长期维护”成为差异化
很多团队在第一个月效果很好,三个月后开始退化:数据更新没跟上、权限变化没同步、来源内容被改写、旧索引残留。RAG 2.0 的核心能力是:让这套系统在持续变化的业务里依然可靠。
本周建议:把“引用”当作产品功能
把引用展示给用户(哪怕只是内部用户),会倒逼你把数据治理与质量做扎实:没有清晰引用,错误很难复盘;有了引用,问题定位与纠错成本会显著下降。