推理引擎·更新于 2026/05/04 00:00
OpenAI 重写 WebRTC 栈,实现低延迟语音 AI 全球部署
OpenAI 公开了其低延迟语音 AI 背后的工程方案:重写 WebRTC 协议栈以支持实时语音交互。核心挑战包括:全球范围内保持 <300ms 的端到端延迟、处理语音活动检测(VAD)与打断逻辑、以及实现平滑的对话轮次切换。技术方案涉及自定义 RTP 传输层、优化编解码器选择(Opus 自适应码率)、以及分布式边缘节点架构来减少网络抖动。文章未披露具体延迟数字或节点数量,但强调了从浏览器原生 WebRTC 迁移到自研栈带来的控制力提升。
速读
OpenAI 自研 WebRTC 栈以 Opus 自适应码率在边缘节点实现端到端低于300ms的语音AI部署,支持打断与轮次切换
相关源 (1)
- OpenAI News · 2026/5/4 00:00:00https://openai.com/index/delivering-low-latency-voice-ai-at-scale