企业知识库中的 RAG 架构实践

背景与问题

企业知识库问答通常从一个很轻的原型开始：上传文档、切分文本、建立向量索引，然后把检索结果交给大模型生成答案。这个路径能很快展示效果，但进入真实业务后，问题会变得复杂。

真正影响落地质量的不是单次问答是否“看起来聪明”，而是系统能否稳定地回答正确的人、正确的问题，并在权限、审计、更新和运营上形成闭环。

一个可生产化的 RAG 系统至少需要包含四层能力：

type KnowledgeChunk = {
  id: string;
  sourceId: string;
  content: string;
  tags: string[];
  permissions: string[];
  updatedAt: string;
};

在企业场景里，权限需要进入检索链路本身，而不是等答案生成后再过滤。否则模型可能已经在上下文中看到了用户无权访问的信息。

更稳妥的做法是把用户身份、组织、角色和数据范围转换为检索约束，让系统只召回当前用户可见的片段。

RAG 的安全边界应该从数据召回开始，而不是从最终回答开始。

第一阶段不要追求一个覆盖所有业务线的大知识库。更好的路径是选择一个明确场景，例如售前方案问答、客服知识助手或内部制度查询，先把数据质量、权限和反馈机制跑通。

当一个场景稳定后，再将数据治理规范、评估集和组件能力复用到更多业务线。这样系统会自然演进为企业级知识基础设施，而不是停留在一次性的演示项目。