推理引擎·更新于 2026/05/04 00:00

OpenAI 重写 WebRTC 栈，实现低延迟语音 AI 全球部署

OpenAI 公开了其低延迟语音 AI 背后的工程方案：重写 WebRTC 协议栈以支持实时语音交互。核心挑战包括：全球范围内保持 <300ms 的端到端延迟、处理语音活动检测（VAD）与打断逻辑、以及实现平滑的对话轮次切换。技术方案涉及自定义 RTP 传输层、优化编解码器选择（Opus 自适应码率）、以及分布式边缘节点架构来减少网络抖动。文章未披露具体延迟数字或节点数量，但强调了从浏览器原生 WebRTC 迁移到自研栈带来的控制力提升。

速读

OpenAI 自研 WebRTC 栈以 Opus 自适应码率在边缘节点实现端到端低于300ms的语音AI部署，支持打断与轮次切换

OpenAI 重写 WebRTC 栈，实现低延迟语音 AI 全球部署

相关源 (1)