大模型·11 天前GPT-5.5 Instant 发布,SubQ 支持 12M 上下文窗口OpenAI 发布 GPT-5.5 Instant,主打低延迟推理,面向实时对话场景。SubQ 推出 12M token 上下文窗口,大幅扩展长文本处理能力。Google 同步升级 Gemini Flash 系列,提升推理效率与多模态能力。三者均聚焦推理阶段优化,降低响应延迟。›1 条相关源
大模型·12 天前Google 四月 AI 更新:Gemma 3.1 与 Gemini 2.5 多项升级Google 在 2026 年 4 月发布多项 AI 产品更新。Gemma 3.1 开源模型新增 4B 和 12B 两种尺寸,支持 128K 上下文窗口,采用后训练优化提升指令遵循能力。Gemini 2.5 Flash 模型在推理成本降低的同时提升了代码生成与多模态理解能力。此外,Google 推出 AI 安全框架 Secure AI Framework (SAIF) 的更新版本,并开源了部分安全评估工具。›1 条相关源