← 返回信息流
推理引擎·更新于 2026/05/04 00:00

OpenAI 重写 WebRTC 栈,实现低延迟语音 AI 全球部署

OpenAI 公开了其低延迟语音 AI 背后的工程方案:重写 WebRTC 协议栈以支持实时语音交互。核心挑战包括:全球范围内保持 <300ms 的端到端延迟、处理语音活动检测(VAD)与打断逻辑、以及实现平滑的对话轮次切换。技术方案涉及自定义 RTP 传输层、优化编解码器选择(Opus 自适应码率)、以及分布式边缘节点架构来减少网络抖动。文章未披露具体延迟数字或节点数量,但强调了从浏览器原生 WebRTC 迁移到自研栈带来的控制力提升。

速读

OpenAI 自研 WebRTC 栈以 Opus 自适应码率在边缘节点实现端到端低于300ms的语音AI部署,支持打断与轮次切换

相关源 (1)