训练框架·更新于 2026/04/24 09:00

SkyRL 开源视觉语言模型强化学习框架

Anyscale 在 SkyRL 中新增视觉语言模型（VLM）强化学习支持。SkyRL 是一个面向 LLM/VLM 强化学习的开源框架，此次更新将 RL 训练从纯文本扩展到多模态场景，支持图像输入与文本输出的联合优化。技术核心在于将视觉编码器与语言模型的 RL 训练流程打通，处理多模态 reward 信号与梯度传播。

速读

Anyscale开源SkyRL框架新增视觉语言模型强化学习支持，实现图像与文本联合优化

SkyRL 开源视觉语言模型强化学习框架

相关源 (1)