推理引擎·25 天前
Ollama v0.21.1 发布:支持 Kimi CLI 与 MLX 推理多项优化
Ollama 发布 v0.21.1 版本,新增 Kimi CLI 启动支持,用户可通过 ollama launch kimi --model kimi-k2.6:cloud 直接运行 Kimi K2.6 多智能体系统,擅长长周期自主执行任务。MLX 运行器新增 logprobs 支持,采样阶段将 top-P 与 top-K 融合为单次排序并加入重复惩罚,提升采样速度;tokenization 移入请求处理 goroutine 以改善延迟;数组管理线程安全性增强。GLM4 MoE Lite 通过融合 sigmoid 路由头提升性能。修复 macOS 应用切换对话后模型显示陈旧、Gemma 4 在 think=false 时结构化输出异常等问题。无破坏性变更。