Appearance
知识库 RAG:给 AI 开卷考试,不是让它裸考
在 Agent 运行时中的位置:用户消息过安检 + Scene 之后,LLM 回答之前——给大模型翻书的时间。
主线 → Agent 运行时 · 步骤 ⑤ + ⑦
先搞清楚:RAG 是什么?(纯概念)
大模型有一个天生缺陷:训练完那一刻,它的知识就冻结了。
你问 GPT-4「今天天气怎么样」——它不知道,它的训练数据截止到某个时间点。你问「晨悦平台的母婴小悦怎么用」——它也不知道,这是你的私有业务知识。
传统做法是让大模型把所有知识都记住(训练时塞进去),但这样贵、慢、还不灵活。
RAG(Retrieval Augmented Generation,检索增强生成) 换了个思路:
不让大模型背答案,而是考试前给它一本书,让它翻着书答题。
类比一下就懂了:
| 场景 | 无 RAG | 有 RAG |
|---|---|---|
| 考试 | 闭卷,全靠记忆 | 开卷,给你一本书现场翻 |
| 医生看病 | 凭经验,可能记错 | 翻医学手册,查到再诊断 |
| AI 回答 | 靠训练记忆,可能编造 | 先搜知识库,找到原文再回答 |
专业定义:
RAG = 用户提问时,先去知识库检索相关内容,把「搜到的」和「用户问的」一起喂给大模型,让大模型基于事实回答问题。
一句话:记忆靠 AI,事实靠文档。
那在晨悦里,它是怎么玩的?(通俗理解)
晨悦母婴馆小悦挂了「育儿百科 KB」。用户问「6 个月宝宝辅食怎么添加」。
没有 RAG:
- 大模型凭记忆编一个答案,「6 个月可以吃米粉、蛋黄……」——可能对,也可能不对。
有 RAG(晨悦实际流程):
用户问「6 个月宝宝辅食怎么添加」
→ 系统把问题转成向量(一串数字,表示「这句话在说什么」)
→ 去育儿百科 KB 搜「最相关的几段原文」
→ 搜到:「WHO 建议满 6 个月开始辅食,首先推荐铁强化米粉……」
→ 把原文 + 用户问题一起塞给大模型
→ 大模型:「根据 WHO 建议,6 个月宝宝应先尝试铁强化米粉,每天 1 次,从 1-2 勺开始……」晨悦的 RAG 就是在用户问到之前,替大模型翻一遍资料。
RAG 三步走:入库 → 检索 → 注入
第一步:入库(文档 → 向量库)
你的文档(PDF/Markdown/FAQ)
→ 切片:按段落/标题切成小块(chunk)
→ 向量化:每块转成数字向量(embedding)
→ 存入:ChromaDB 向量库| 文档类型 | 切片策略 | 举例 |
|---|---|---|
| FAQ | 按 Q&A 对切 | 「Q:怎么退货 A:7天无理由」 |
| API 文档 | 按接口切 | 一个 API endpoint = 一个 chunk |
| 长文/教程 | 按标题段切 | ## 标题 + 下文段落 |
| 商品库 | 不用 KB | 价格/库存走 API 实时查 |
商品不走 KB
价格变化太频繁(今天 99 明天 79),放进 KB 会过时。母婴案例里商品信息走 Tool/Plugin 实时调接口。
第二步:检索(用户提问 → 搜库)
用户提问 → 同样向量化 → 和 KB 里所有文档算相似度 → 返回最相关的 top_k 条。
检索质量由 top_k(返回几条)和 min_score(最低相似度门槛)控制。
第三步:注入(检索结果 → 上下文 → LLM)
搜到的原文 + 用户原始问题 → 拼成完整 Prompt → 交给大模型生成最终回答。
⚡ 常见误区(KB 配不好比没有更糟)
| 误区 | 后果 | 正确姿势 |
|---|---|---|
| 不切片,整篇丢 | 检索时返回整篇文章,LLM 在 5000 字里找「辅食」二字 | 按段落/QA 对切,chunk 控制在 500-1000 字 |
| FAQ 当长文切 | 「怎么退货」只搜到「我们支持7天无理由」的后半句 | FAQ 按 Q&A 完整对切 |
| 商品信息放进 KB | 昨天存的价格今天已过期,用户看到错误价格 | 商品走 API,不走 KB |
| 多个场景共用一个 KB | 育儿 KB 里混了 AgentPM 的方法论,检索互相污染 | 一个场景一个 KB,互不干扰 |
| 只存不维护 | 政策变了 KB 没更新,AI 还在回答旧版 | 建立定期更新流程,每次产品改版同步刷新 KB |
看看两个真实的 Agent 怎么用 KB
晨悦母婴馆小悦
KB 内容 → 育儿百科(辅食、疫苗、发育)、购物指南
切片策略 → 按子主题分片(feeding / development / shopping_guide)
检索时机 → 每次用户提问都搜(prepare_context)
二次注入 → Knowledge Skill 再搜一轮
配套 → 商品不走 KB,用 Tool Skill 实时查价格AgentPM
KB 内容 → PRD 规范、SDAD 节选、案例摘要
切片策略 → 按方法论章节切(Sensing / Definition / Architecture / Delivery)
检索时机 → 需求类问题触发
配套 → 配合 Prompt Skill 约束交付格式5 分钟动手
- flow-admin → 知识库 → 新建
- 上传 3 份文档(比如育儿科普文),选「长文切片」
- 等向量化完成(看进度条)
- 去 Agent 编辑页,挂上这个 KB ID
- 问一个文档里有的问题,看它能不能引用原文回答
→ 更多实操:Lab 1 · Agent + KB
思维导图
相关文档
- Agent 运行时 — RAG 在链路中的两个触发点
- Agent Skills — Knowledge Skill 的二次注入机制
- 进阶 RAG — 评测策略与黄金 Q&A 集