InfoPie · AI · 大模型 · 数据库

4月24日周五

1 条

训练框架·23 天前

SkyRL 开源视觉语言模型强化学习框架

Anyscale 在 SkyRL 中新增视觉语言模型（VLM）强化学习支持。SkyRL 是一个面向 LLM/VLM 强化学习的开源框架，此次更新将 RL 训练从纯文本扩展到多模态场景，支持图像输入与文本输出的联合优化。技术核心在于将视觉编码器与语言模型的 RL 训练流程打通，处理多模态 reward 信号与梯度传播。

4月24日 周五

SkyRL 开源视觉语言模型强化学习框架

4月24日周五