Update documentation for Realtime Agent Studio with enhanced content and structure
- Revised site name and description for clarity and detail. - Updated navigation structure to better reflect the organization of content. - Improved changelog entries for better readability and consistency. - Migrated assistant configuration and prompt guidelines to new documentation paths. - Enhanced core concepts section to clarify the roles and capabilities of assistants and engines. - Streamlined workflow documentation to provide clearer guidance on configuration and usage.
This commit is contained in:
@@ -1,25 +1,25 @@
|
||||
# 语音生成
|
||||
# TTS 参数
|
||||
|
||||
语音生成(TTS)负责将助手回复文本转换为可播放音频。
|
||||
TTS 参数决定助手语音输出的节奏、音量和听感。本页只讨论参数层面的调优建议。
|
||||
|
||||
## 配置项
|
||||
## 常用参数
|
||||
|
||||
| 配置项 | 说明 |
|
||||
|---|---|
|
||||
| TTS 引擎 | 选择语音合成服务提供商 |
|
||||
| 声音/音色 | 选择目标音色或发音人 |
|
||||
| 模型 | 语音合成模型名称 |
|
||||
| 语速 | 播放速度,通常 0.5-2.0 |
|
||||
| 音量/增益 | 输出音量控制 |
|
||||
| 音调 | 声线高低调整 |
|
||||
| 参数 | 说明 | 常见范围 |
|
||||
|------|------|----------|
|
||||
| **语速** | 说话速度 | `0.5 - 2.0` |
|
||||
| **音量 / 增益** | 输出音量强弱 | 供应商自定义 |
|
||||
| **音调** | 声线高低 | 供应商自定义 |
|
||||
| **模型** | 合成模型名称 | 依供应商而定 |
|
||||
| **声音 ID** | 发音人或音色标识 | 依供应商而定 |
|
||||
|
||||
## 建议
|
||||
## 调优建议
|
||||
|
||||
- 对话助手建议保持语速在 `0.9-1.2`
|
||||
- 生产环境建议固定主音色,降低体验波动
|
||||
- 若需要打断能力,优先使用低延迟流式 TTS
|
||||
- 对话助手通常建议把语速控制在 `0.9 - 1.2`
|
||||
- 需要打断能力的场景,优先选择低延迟流式 TTS,并避免过长的单次回复
|
||||
- 如果业务强调可信度或专业感,先保证清晰度和稳定性,再追求个性化音色
|
||||
- 不要只试听一句问候语,至少用三类文案对比:短答复、长答复、数字或专有名词较多的答复
|
||||
|
||||
## 相关文档
|
||||
|
||||
- [语音配置总览](voices.md)
|
||||
|
||||
- [声音资源](voices.md) - 先选择适合的供应商、模型和音色
|
||||
- [语音识别](asr.md) - 结合输入侧延迟一起评估整条语音链路
|
||||
|
||||
Reference in New Issue
Block a user