Files
AI-VideoAssistant/docs/content/changelog.md
Xin Wang b300b469dc Update documentation for Realtime Agent Studio with enhanced content and structure
- Revised site name and description for clarity and detail.
- Updated navigation structure to better reflect the organization of content.
- Improved changelog entries for better readability and consistency.
- Migrated assistant configuration and prompt guidelines to new documentation paths.
- Enhanced core concepts section to clarify the roles and capabilities of assistants and engines.
- Streamlined workflow documentation to provide clearer guidance on configuration and usage.
2026-03-09 05:38:43 +08:00

1.9 KiB
Raw Permalink Blame History

更新日志

本文档记录 Realtime Agent Studio 的所有重要变更。

格式基于 Keep a Changelog 版本号遵循 语义化版本


未发布

开发中

  • 工作流可视化编辑器
  • 知识库 RAG 集成
  • JavaScript/Python SDK
  • Step Audio 多模态模型支持

0.1.0 - 2025-01-15

新增

实时交互引擎

  • 管线式全双工引擎 - ASR → LLM → TTS 流水线架构
  • 智能打断 - 支持 VAD 和 EOU 检测
  • OpenAI 兼容接口 - 支持 OpenAI Compatible 的 ASR/TTS 服务
  • DashScope TTS - 阿里云语音合成服务适配

助手配置

  • 系统提示词 - 支持角色定义和动态变量 {{variable}}
  • 模型管理 - LLM/ASR/TTS 模型统一管理界面
  • 工具调用 - Webhook 工具和客户端工具配置

交互测试

  • 实时调试控制台 - 内置 WebSocket 调试工具

开放接口

  • WebSocket 协议 - /ws 端点,支持二进制音频流
  • RESTful API - 完整的助手/模型/会话 CRUD 接口

历史监控

  • 会话回放 - 音频 + 转写 + LLM 响应完整记录
  • 会话筛选 - 按时间、助手、状态多维度检索

部署

  • Docker 支持 - 提供 docker-compose 一键部署

技术栈

  • 前端React 18, TypeScript, Tailwind CSS, Zustand
  • 后端FastAPI (Python 3.10+)
  • 数据库SQLite开发/ PostgreSQL生产

版本规划

版本 计划发布 主要特性
0.2.0 2025 Q1 工作流编辑器、知识库集成
0.3.0 2025 Q2 SDK 发布、多模态模型
1.0.0 2025 H2 生产就绪、企业特性

贡献者

感谢所有为 RAS 做出贡献的开发者!