昨天 · 5月16日 周六

1
大模型·1 天前

Qwen3.6-35B-A3B 登顶 Terminal-Bench 2.0,超越 Gemini 2.5 Pro

5月15日 周五

6
工具发布·1 天前

Claude Code v2.1.143 发布:插件依赖强制、背景会话直接编辑工作副本

工具发布·1 天前

Equibles 开源 MCP 服务器,让本地 LLM 获取实时美国金融数据

大模型·2 天前

Intern-S2-Preview:35B 科学多模态模型通过任务缩放逼近万亿参数性能

大模型·2 天前

Anthropic 用 5 天让 Claude 自主攻破 macOS 安全防线

论文速递·2 天前

AI Agent 在 2 万文件工作区中仅达 43% 准确率,Workspace-Bench 发布

论文速递·2 天前

PersonalHomeBench:智能家居Agent评测框架发布

5月14日 周四

4
工具发布·2 天前

Claude Code v2.1.142 新增 agents 多参数,修复 macOS 休眠后守护进程崩溃

大模型·2 天前

Anthropic 强制默认 Adaptive Thinking,固定推理预算选项被废弃

大模型·2 天前

Anthropic 推出 Claude 认证架构师考试

大模型·3 天前

开发者实测:Claude Code Opus 4.7 零错误完胜 GPT-5.5 Codex,但价格差距在缩小

5月13日 周三

4
工具发布·3 天前

Claude Code v2.1.141 新增终端序列与工作负载身份联合

大模型·3 天前

Anthropic 将 Claude --print 划入 SDK 计费,CLI 自动化方案遭堵

工具发布·3 天前

Claude Code 终端隐藏命令:资深开发者分享 5 个提效技巧

系统与分布式·3 天前

OpenAI 为 Codex 构建 Windows 沙箱:安全执行编程 Agent

5月12日 周二

4
工具发布·4 天前

Claude Code v2.1.140 发布:修复 /goal 挂起与 Windows 事件循环卡死

工具发布·4 天前

Claude Code 静默切换计费:.env 中的 API Key 会覆盖 Max 订阅

工具发布·5 天前

Claude Code 上线 /goal 异步模式,支持"跑完为止"后台任务

大模型·5 天前

OpenAI 办参数高尔夫赛:千名选手探索AI辅助模型设计极限

5月11日 周一

4
工具发布·5 天前

Claude Code 推出 Agent View:多会话并行调度

工具发布·5 天前

LLM 工具可直接写在 Shebang 行中执行脚本

工具发布·5 天前

Claude Code v2.1.139 新增 Agent 视图与 /goal 持续执行命令

工具发布·6 天前

子目录放 AGENTS.md 可分层注入上下文节省 Token

5月10日 周日

2
大模型·6 天前

Claude Mythos 把 METR 基准测试曲线跑爆了

大模型·7 天前

Qwen 3.6 27B 离线跑分接近 Opus,Hugging Face 联合创始人实测

5月9日 周六

1
工具发布·8 天前

Claude 桌面端上线上下文用量可视化

5月8日 周五

3
工具发布·8 天前

Codex Rust v0.130.0 发布,新增 remote-control 与 Bedrock 认证

大模型·8 天前

用 HTML 替代 Markdown 作为 LLM 输出格式,交互式图表与 SVG 让解释更直观

大模型·8 天前

OpenAI 如何安全运行 Codex:沙箱与代理原生可观测

5月7日 周四

4
工具发布·9 天前

Claude Code v2.1.133 发布,新增 worktree 分支策略与内存压力回收

工具发布·9 天前

Mozilla 借助 Claude Mythos 预览版将 Firefox 安全修复量提升至 423 个/月

工具发布·9 天前

Codex 0.129.0 发布:TUI 支持 Vim 模式与工作流恢复增强

系统与分布式·10 天前

从单智能体到多智能体:Ray Serve 架构演进实践

5月6日 周三

3
工具发布·10 天前

Claude Code v2.1.132 修复终端崩溃与粘贴异常等 14 项问题

工具发布·11 天前

Claude Code v2.1.129 发布:插件 URL 加载与 Homebrew 自动更新

大模型·11 天前

OpenAI 发布 B2B Signals 报告:前沿企业如何深化 AI 采纳

5月4日 周一

1
工具发布·12 天前

Claude Code v2.1.128 发布:MCP 工具计数、OTEL 隔离与插件 ZIP 支持

5月1日 周五

1
工具发布·16 天前

Claude Code v2.1.126 发布:模型网关支持与项目状态清理

4月28日 周二

3
工具发布·18 天前

Claude Code v2.1.122 发布:支持 Bedrock 服务层级选择与多项修复

工具发布·19 天前

Claude Code v2.1.121 发布:MCP alwaysLoad、技能搜索与全屏交互改进

大模型·19 天前

OpenAI 模型与 Codex 登陆 AWS,企业可托管 AI Agent

4月27日 周一

1
工具发布·20 天前

OpenAI 开源 Codex 编排规范 Symphony

4月23日 周四

5
工具发布·23 天前

Claude Code v2.1.119 发布:设置持久化、GitLab PR 支持、OpenTelemetry 增强

大模型·23 天前

OpenAI 发布 GPT-5.5 系统卡,披露安全与能力评估

工具发布·24 天前

ClickHouse MCP 服务器接入 Google Antigravity,自然语言查数据库

工具发布·24 天前

Claude Code v2.1.118 发布:Vim 视觉模式、/usage 合并、MCP 钩子增强

大模型·24 天前

OpenAI 推出 Workspace Agents,Google 发布 Workspace Intelligence

4月22日 周三

3
推理引擎·24 天前

Google 发布两款专用 TPU 第八代芯片,面向 Agent 时代

系统与分布式·25 天前

Anyscale 推出 Agent Skills:基于 Ray 的 AI 工作负载调试与优化工具

工具发布·25 天前

Claude Code v2.1.117 发布:子代理分叉、bfs/ugrep 原生搜索、OpenTelemetry 增强