昨天 · 5月16日 周六

1
论文速递·1 天前

δ-mem 提出在线记忆机制,让 LLM 长上下文推理效率提升 3 倍

5月15日 周五

1
大模型·2 天前

Intern-S2-Preview:35B 科学多模态模型通过任务缩放逼近万亿参数性能

5月12日 周二

1
大模型·5 天前

OpenAI 办参数高尔夫赛:千名选手探索AI辅助模型设计极限

5月5日 周二

3
工具发布·11 天前

Transformers v5.8.0 发布:原生支持 DeepSeek-V4 与 Gemma 4 投机解码

大模型·12 天前

GPT-5.5 Instant 上线:幻觉降低、个性化增强

大模型·12 天前

OpenAI 发布 GPT-5.5 Instant 系统卡,推理延迟大幅降低

4月29日 周三

1
大模型·17 天前

OpenAI 披露 GPT-5 人格化输出"地精"现象的根因与修复

4月28日 周二

1
工具发布·18 天前

Transformers v5.7.0 发布:Laguna MoE 与 DEIMv2 目标检测模型加入

4月23日 周四

3
推理引擎·23 天前

Transformers v5.6.2 紧急修复 Qwen 3.5/3.6 MoE 在 FP8 下的推理崩溃

大模型·23 天前

OpenAI 发布 GPT-5.5 系统卡,披露安全与能力评估

推理引擎·24 天前

Transformers v5.6.1 紧急修复 Flash Attention 路径崩溃