← 返回信息流
推理引擎·更新于 2026/04/23 18:36

Transformers v5.6.2 紧急修复 Qwen 3.5/3.6 MoE 在 FP8 下的推理崩溃

Hugging Face Transformers 发布 v5.6.2 补丁版本。此前 v5.6.x 中 Qwen 3.5 和 3.6 的 MoE(仅文本)模型在使用 FP8 精度推理时出现崩溃,本次补丁修复了配置读取与 kernel 错误处理逻辑(PR #45610),使 FP8 下的 MoE 推理恢复正常。无破坏性变更,仅修复 bug。

速读

Transformers v5.6.2 紧急修复 Qwen 3.5/3.6 MoE 在 FP8 下的推理崩溃

相关源 (1)