训练框架·23 天前SkyRL 开源视觉语言模型强化学习框架Anyscale 在 SkyRL 中新增视觉语言模型(VLM)强化学习支持。SkyRL 是一个面向 LLM/VLM 强化学习的开源框架,此次更新将 RL 训练从纯文本扩展到多模态场景,支持图像输入与文本输出的联合优化。技术核心在于将视觉编码器与语言模型的 RL 训练流程打通,处理多模态 reward 信号与梯度传播。›1 条相关源