5月10日 周日

1
推理引擎·7 天前

vLLM v0.20.2 发布:修复 DeepSeek V4 稀疏注意力与 KV 缓存分配

5月5日 周二

1
工具发布·11 天前

Transformers v5.8.0 发布:原生支持 DeepSeek-V4 与 Gemma 4 投机解码

5月4日 周一

1
推理引擎·12 天前

vLLM v0.20.1 发布:DeepSeek V4 推理稳定性与性能优化

4月27日 周一

1
推理引擎·19 天前

vLLM v0.20.0 发布:DeepSeek V4 支持、CUDA 13 默认、PyTorch 2.11 升级