← 返回信息流
训练框架·更新于 2026/04/24 09:00

SkyRL 开源视觉语言模型强化学习框架

Anyscale 在 SkyRL 中新增视觉语言模型(VLM)强化学习支持。SkyRL 是一个面向 LLM/VLM 强化学习的开源框架,此次更新将 RL 训练从纯文本扩展到多模态场景,支持图像输入与文本输出的联合优化。技术核心在于将视觉编码器与语言模型的 RL 训练流程打通,处理多模态 reward 信号与梯度传播。

速读

Anyscale开源SkyRL框架新增视觉语言模型强化学习支持,实现图像与文本联合优化

相关源 (1)