Files

Xin Wang b300b469dc Update documentation for Realtime Agent Studio with enhanced content and structure

- Revised site name and description for clarity and detail.
- Updated navigation structure to better reflect the organization of content.
- Improved changelog entries for better readability and consistency.
- Migrated assistant configuration and prompt guidelines to new documentation paths.
- Enhanced core concepts section to clarify the roles and capabilities of assistants and engines.
- Streamlined workflow documentation to provide clearer guidance on configuration and usage.

2026-03-09 05:38:43 +08:00

2.9 KiB

Raw Blame History

知识库

知识库负责承载助手需要引用的私有事实、业务资料和长文档内容，是 RAG（检索增强生成）能力的正式说明页。

什么时候应该用知识库

当问题答案主要来自“稳定文档”而不是实时外部动作时，优先使用知识库：

产品说明、政策条款、操作流程、培训材料
内部手册、FAQ、规范文档
需要被多位助手复用的领域知识

如果任务本质上是“查状态、写数据、执行动作”，那通常更适合工具，而不是知识库。

工作原理

flowchart LR
    subgraph Indexing["索引阶段"]
        Doc[文档] --> Chunk[分块]
        Chunk --> Embed[向量化]
        Embed --> Store[(向量数据库)]
    end

    subgraph Query["查询阶段"]
        Q[用户问题] --> Search[相似度检索]
        Store --> Search
        Search --> Context[相关片段]
        Context --> LLM[LLM 生成回答]
    end

核心原则很简单：把长文档转成可检索的片段，在用户提问时只把最相关的内容送给模型。

适合放进知识库的内容

适合	不适合
稳定规则、标准答案、产品文档	高频变化的实时状态
领域术语、说明手册、培训材料	需要外部系统写入或变更的动作
需要跨助手复用的内容	只在单次会话里临时生成的数据

内容准备建议

优先上传结构清晰、主题明确的文档
对超长文档按主题拆分，减少一次索引的噪声
标题、章节名和表格说明对召回质量很重要，不要全部删掉格式信息
与其堆很多相近文档，不如先清理重复、过期和相互冲突的内容

常见配置项

配置项	作用	常见做法
相似度阈值	过滤弱相关结果	从保守值起步，再按误召回调
返回数量	控制一次送给模型的候选片段数	先少后多，避免上下文污染
分块大小	决定每个文档片段的长度	按文档类型和问题粒度调整

创建与维护

最小流程

新建知识库
上传文档
完成索引
用典型问题测试召回结果
绑定到目标助手

日常维护

删除过期或互相矛盾的文档
当业务口径变化时，优先更新知识库而不是只改提示词
为关键问题准备固定测试问句，观察召回是否稳定

与助手的关系

知识库不是独立产品入口，而是助手的能力层：

助手决定是否、何时、以什么风格使用知识
知识库决定能够提供哪些事实片段
工作流和工具可以与知识库并用，但承担不同职责

2.9 KiB Raw Blame History Unescape Escape

知识库