系统与分布式·更新于 2026/05/15 09:00
Anyscale 推出持久化 Cluster 与 Actor 仪表盘,可回溯调试 Ray 工作负载
Anyscale 为其托管 Ray 平台新增了完全持久化的 Cluster Dashboard 和 Actor Dashboard。传统 Ray 仪表盘仅在集群运行时可用,一旦作业结束或集群关闭,历史状态即丢失。新方案将仪表盘数据持久化存储,用户可在作业完成后回溯查看集群资源使用曲线、Actor 生命周期、任务分布等关键指标,无需重新运行作业即可进行事后调试。技术核心是将 Ray 的运行时指标导出到外部存储后端,并通过独立于集群生命周期的 Web 服务提供查询接口。
速读
Anyscale 推出持久化集群与 Actor 仪表盘,支持回溯调试已结束作业并定位分布式内存泄漏
相关源 (1)
- Anyscale Blog · 2026/5/15 09:00:00https://anyscale.com/blog/monitor-and-debug-with-cluster-and-actor-dashboard