Add opener audio functionality to Assistant model and related schemas, enabling audio generation and playback features. Update API routes and frontend components to support opener audio management, including status retrieval and generation controls.

2026-02-26 14:31:50 +08:00
parent 833cb0d4c4
commit fb95e2abe2
9 changed files with 551 additions and 4 deletions
--- a/engine/app/config.py
+++ b/engine/app/config.py
@@ -60,6 +60,7 @@ _AGENT_SECTION_KEY_MAP: Dict[str, Dict[str, str]] = {
        "enabled": "duplex_enabled",
        "greeting": "duplex_greeting",
        "system_prompt": "duplex_system_prompt",
+        "opener_audio_file": "duplex_opener_audio_file",
    },
    "barge_in": {
        "min_duration_ms": "barge_in_min_duration_ms",
@@ -96,6 +97,7 @@ _AGENT_SETTING_KEYS = {
    "duplex_enabled",
    "duplex_greeting",
    "duplex_system_prompt",
+    "duplex_opener_audio_file",
    "barge_in_min_duration_ms",
    "barge_in_silence_tolerance_ms",
    "tools",
@@ -452,6 +454,10 @@ class Settings(BaseSettings):
        default="You are a helpful, friendly voice assistant. Keep your responses concise and conversational.",
        description="System prompt for LLM"
    )
+    duplex_opener_audio_file: Optional[str] = Field(
+        default=None,
+        description="Optional opener audio file path for standalone engine mode (.pcm or .wav)"
+    )
    
    # Barge-in (interruption) Configuration
    barge_in_min_duration_ms: int = Field(