每日早报

2026 年 5 月 17 日 · 周日·4 条精选
  1. 01

    本地 Qwen 3.6 量化版单文件编码任务直追前沿模型

  2. 02

    llama.cpp b9180 支持 MTP 推测解码与 GDN 部分回滚

  3. 03

    Strix Halo 实测:llama.cpp MTP 让 27B 模型生成速度翻倍

  4. 04

    δ-mem 提出在线记忆机制,让 LLM 长上下文推理效率提升 3 倍