← 返回信息流
推理引擎·更新于 2026/05/05 17:13

Ollama v0.23.1 发布,Mac 上 Gemma 4 推理速度翻倍

Ollama v0.23.1 发布,核心更新是为 MLX runner 添加了 Gemma 4 MTP(Multi-token Processing)投机解码支持。在 Mac 上运行 Gemma 4 31B 编码模型时,该特性可带来超过 2 倍的加速。此外,本次更新还升级了 Go 1.26,并修复了 MLX 和 MLX-C 的线程问题。无破坏性变更。

速读

Ollama v0.23.1 为 Mac 引入 Gemma 4 MTP 投机解码,使 31B 编码模型推理速度翻倍

相关源 (1)