推理引擎·更新于 2026/04/23 18:36
Transformers v5.6.2 紧急修复 Qwen 3.5/3.6 MoE 在 FP8 下的推理崩溃
Hugging Face Transformers 发布 v5.6.2 补丁版本。此前 v5.6.x 中 Qwen 3.5 和 3.6 的 MoE(仅文本)模型在使用 FP8 精度推理时出现崩溃,本次补丁修复了配置读取与 kernel 错误处理逻辑(PR #45610),使 FP8 下的 MoE 推理恢复正常。无破坏性变更,仅修复 bug。
速读
Transformers v5.6.2 紧急修复 Qwen 3.5/3.6 MoE 在 FP8 下的推理崩溃
相关源 (1)
- Transformers Releases · 2026/4/23 18:36:03https://github.com/huggingface/transformers/releases/tag/v5.6.2