Files
AI-VideoAssistant/docs/content/customization/models.md

951 B

模型配置

LLM 模型库

LLM模型库

支持的模型

供应商 模型 特点
OpenAI GPT-4 / GPT-3.5 通用能力强
DeepSeek DeepSeek Chat 高性价比
SiliconFlow 多种开源模型 本地部署友好
Google Gemini Pro 多模态支持

配置步骤

  1. 进入 LLM 库 页面
  2. 点击 添加模型
  3. 选择供应商
  4. 填写 API Key 和 Endpoint
  5. 设置默认参数

参数说明

参数 说明 建议值
Temperature 随机性 0.7
Max Tokens 最大输出长度 2048
Top P 核采样 0.9

ASR 语音识别

支持引擎

  • Whisper - OpenAI 通用语音识别
  • SenseVoice - 高精度中文语音识别

配置方法

  1. 进入 ASR 库 页面
  2. 选择识别引擎
  3. 配置音频参数(采样率、编码)
  4. 测试识别效果