推理引擎·更新于 2026/05/05 17:13
Ollama v0.23.1 发布,Mac 上 Gemma 4 推理速度翻倍
Ollama v0.23.1 发布,核心更新是为 MLX runner 添加了 Gemma 4 MTP(Multi-token Processing)投机解码支持。在 Mac 上运行 Gemma 4 31B 编码模型时,该特性可带来超过 2 倍的加速。此外,本次更新还升级了 Go 1.26,并修复了 MLX 和 MLX-C 的线程问题。无破坏性变更。
速读
Ollama v0.23.1 为 Mac 引入 Gemma 4 MTP 投机解码,使 31B 编码模型推理速度翻倍
相关源 (1)
- Ollama Releases · 2026/5/5 17:13:31https://github.com/ollama/ollama/releases/tag/v0.23.1