大模型·更新于 2026/05/16 19:51
本地 Qwen 3.6 量化版单文件编码任务直追前沿模型
Reddit 用户用同一段 prompt(单 HTML 文件 + Canvas 实现汽车驾驶动画,含视差滚动、车轮旋转、光影效果)对比了本地量化模型与前沿闭源模型的编码能力。本地端测试了 Qwen3.6-27B/35B、Qwen3.5 9B/4B、Gemma-4-31b 等量化版本(Q4_K_M/Q8),在 Ryzen 5 5600 + 24GB DDR4 + RX 5700 XT 8GB 上运行,Qwen3.6-35B A3B Q4_K_M 达到 12.13 tok/s,而 Qwen3.6-27B 仅约 2.7 tok/s。前沿端通过 Perplexity 调用 Claude Sonnet 4.6 Thinking、Gemini 3.1 Pro Thinking、GPT 5.4 Thinking、Kimi k2.6 Thinking。评测聚焦于动画真实感、视差层次、车轮旋转与车身联动等视觉质量,而非标准 benchmark 分数。
速读
Qwen 3.6 量化版在单文件编码任务中与前沿模型对比
相关源 (1)
- r/LocalLLaMA · 2026/5/16 19:51:05https://www.reddit.com/gallery/1tf3p6c