系统与分布式·更新于 2026/05/05 10:00
OpenAI 开源 MRC 协议:大规模 AI 训练网络的多路径可靠连接
OpenAI 通过 OCP 发布 MRC(Multipath Reliable Connection)协议,旨在提升大规模 AI 训练集群网络的弹性与性能。MRC 是一种新的传输层协议,针对 AI 训练中常见的网络拓扑(如 Clos 或 Dragonfly)和 RDMA 通信模式做了专门优化,通过多路径并发与快速重传机制减少链路故障对训练作业的影响。协议已通过 OCP 开放,供社区评估与集成。
速读
OpenAI 通过 OCP 开源 MRC 协议,以多路径快速重传提升 AI 训练集群弹性与吞吐
相关源 (1)
- OpenAI News · 2026/5/5 10:00:00https://openai.com/index/mrc-supercomputer-networking