5月14日 周四

1
推理引擎·2 天前

vLLM 发布 TurboQuant 全面评测:FP8 仍是 KV Cache 量化最佳默认方案