Files
AI-VideoAssistant/docs/content/customization/models.md
Xin Wang b300b469dc Update documentation for Realtime Agent Studio with enhanced content and structure
- Revised site name and description for clarity and detail.
- Updated navigation structure to better reflect the organization of content.
- Improved changelog entries for better readability and consistency.
- Migrated assistant configuration and prompt guidelines to new documentation paths.
- Enhanced core concepts section to clarify the roles and capabilities of assistants and engines.
- Streamlined workflow documentation to provide clearer guidance on configuration and usage.
2026-03-09 05:38:43 +08:00

2.2 KiB

LLM 模型

本页是资源库中 LLM 模型的正式说明页,聚焦文本生成、嵌入和重排模型的接入与选择。

这页负责什么

当你需要为助手配置“理解与生成能力”时,请从这里开始决定:

  • 使用哪个供应商或模型家族
  • 该模型负责文本生成、嵌入还是重排
  • 接口地址、认证信息和默认参数如何设置

语音识别和语音合成分别由 语音识别声音资源 说明,不在本页重复。

模型类型

类型 用途 常见场景
文本模型 生成回复、总结、分类、规划 助手主对话、工具调用决策
嵌入模型 向量化文档或查询 知识库检索
重排模型 对检索结果再次排序 提升知识召回质量

配置清单

配置项 说明 建议
供应商 OpenAI 兼容、托管平台或自建服务 用统一命名规范区分环境
模型名称 控制台中的显示名称 体现厂商、用途和环境
模型标识 请求中实际使用的 model 名称 保持与供应商文档一致
Base URL 接口地址 为不同环境分别配置
API Key / Token 鉴权凭证 与显示名称配套管理
默认参数 Temperature、Max Tokens、上下文长度等 按业务场景收敛默认值

选择建议

  • 先按用途选模型,再按成本和延迟筛选供应商
  • 文本模型不要承担知识库检索职责:检索应交给嵌入与重排模型
  • 为不同环境建立清晰命名:如 prod-gpt4o-ministaging-qwen-text
  • 默认参数要保守:让助手默认稳定,再在单个场景内按需调优

常见组合

目标 推荐组合
通用对话助手 1 个文本模型
知识问答助手 文本模型 + 嵌入模型
高质量知识召回 文本模型 + 嵌入模型 + 重排模型

下一步