推理引擎·13 天前OpenAI 重写 WebRTC 栈,实现低延迟语音 AI 全球部署OpenAI 公开了其低延迟语音 AI 背后的工程方案:重写 WebRTC 协议栈以支持实时语音交互。核心挑战包括:全球范围内保持 <300ms 的端到端延迟、处理语音活动检测(VAD)与打断逻辑、以及实现平滑的对话轮次切换。技术方案涉及自定义 RTP 传输层、优化编解码器选择(Opus 自适应码率)、以及分布式边缘节点架构来减少网络抖动。文章未披露具体延迟数字或节点数量,但强调了从浏览器原生 WebRTC 迁移到自研栈带来的控制力提升。›1 条相关源