昨天 · 5月16日 周六

3
大模型·14 小时前

本地 Qwen 3.6 量化版单文件编码任务直追前沿模型

推理引擎·17 小时前

Strix Halo 实测:llama.cpp MTP 让 27B 模型生成速度翻倍

大模型·1 天前

Qwen3.6-35B-A3B 登顶 Terminal-Bench 2.0,超越 Gemini 2.5 Pro

5月15日 周五

2
论文速递·2 天前

AI Agent 在 2 万文件工作区中仅达 43% 准确率,Workspace-Bench 发布

论文速递·2 天前

PersonalHomeBench:智能家居Agent评测框架发布

5月14日 周四

1
大模型·3 天前

开发者实测:Claude Code Opus 4.7 零错误完胜 GPT-5.5 Codex,但价格差距在缩小

5月12日 周二

2
推理引擎·5 天前

调大 ubatch 让 llama.cpp MoE 模型预填提速 5.5 倍

大模型·5 天前

OpenAI 办参数高尔夫赛:千名选手探索AI辅助模型设计极限

5月10日 周日

4
推理引擎·6 天前

推测解码加速取决于任务类型:代码快三倍,创作反而变慢

推理引擎·6 天前

8GB显存跑190K上下文:Qwen3.6-35B-A3B + llama.cpp TurboQuant 实测

大模型·6 天前

Claude Mythos 把 METR 基准测试曲线跑爆了

大模型·7 天前

Qwen 3.6 27B 离线跑分接近 Opus,Hugging Face 联合创始人实测

5月5日 周二

2
大模型·12 天前

GPT-5.5 Instant 上线:幻觉降低、个性化增强

大模型·12 天前

OpenAI 发布 GPT-5.5 Instant 系统卡,推理延迟大幅降低