昨天 · 5月16日 周六

1
大模型·1 天前

Qwen3.6-35B-A3B 登顶 Terminal-Bench 2.0,超越 Gemini 2.5 Pro

5月15日 周五

6
工具发布·1 天前

Claude Code v2.1.143 发布:插件依赖强制、背景会话直接编辑工作副本

工具发布·1 天前

Equibles 开源 MCP 服务器,让本地 LLM 获取实时美国金融数据

大模型·1 天前

Intern-S2-Preview:35B 科学多模态模型通过任务缩放逼近万亿参数性能

大模型·1 天前

Anthropic 用 5 天让 Claude 自主攻破 macOS 安全防线

论文速递·2 天前

AI Agent 在 2 万文件工作区中仅达 43% 准确率,Workspace-Bench 发布

论文速递·2 天前

PersonalHomeBench:智能家居Agent评测框架发布

5月14日 周四

5
工具发布·2 天前

Claude Code v2.1.142 新增 agents 多参数,修复 macOS 休眠后守护进程崩溃

大模型·2 天前

Anthropic 强制默认 Adaptive Thinking,固定推理预算选项被废弃

大模型·2 天前

Anthropic 推出 Claude 认证架构师考试

训练框架·2 天前

Anyscale 发布 Agent Skill 工具,强化 LLM 后训练阶段

大模型·3 天前

开发者实测:Claude Code Opus 4.7 零错误完胜 GPT-5.5 Codex,但价格差距在缩小

5月13日 周三

5
工具发布·3 天前

Claude Code v2.1.141 新增终端序列与工作负载身份联合

大模型·3 天前

Anthropic 将 Claude --print 划入 SDK 计费,CLI 自动化方案遭堵

工具发布·3 天前

TextGen 从 Web UI 变身原生桌面应用,对标 LM Studio

工具发布·3 天前

Claude Code 终端隐藏命令:资深开发者分享 5 个提效技巧

系统与分布式·3 天前

OpenAI 为 Codex 构建 Windows 沙箱:安全执行编程 Agent

5月12日 周二

4
工具发布·4 天前

Claude Code v2.1.140 发布:修复 /goal 挂起与 Windows 事件循环卡死

工具发布·4 天前

Claude Code 静默切换计费:.env 中的 API Key 会覆盖 Max 订阅

工具发布·5 天前

Claude Code 上线 /goal 异步模式,支持"跑完为止"后台任务

大模型·5 天前

OpenAI 办参数高尔夫赛:千名选手探索AI辅助模型设计极限

5月11日 周一

4
工具发布·5 天前

Claude Code 推出 Agent View:多会话并行调度

工具发布·5 天前

LLM 工具可直接写在 Shebang 行中执行脚本

工具发布·5 天前

Claude Code v2.1.139 新增 Agent 视图与 /goal 持续执行命令

工具发布·6 天前

子目录放 AGENTS.md 可分层注入上下文节省 Token

5月10日 周日

2
大模型·6 天前

Claude Mythos 把 METR 基准测试曲线跑爆了

大模型·7 天前

Qwen 3.6 27B 离线跑分接近 Opus,Hugging Face 联合创始人实测

5月9日 周六

1
工具发布·8 天前

Claude 桌面端上线上下文用量可视化

5月8日 周五

4
工具发布·8 天前

Codex Rust v0.130.0 发布,新增 remote-control 与 Bedrock 认证

大模型·8 天前

用 HTML 替代 Markdown 作为 LLM 输出格式,交互式图表与 SVG 让解释更直观

工具发布·8 天前

Claude Code v2.1.136 修复 MCP OAuth 并发刷新令牌丢失与 WSL2 粘贴

大模型·8 天前

OpenAI 如何安全运行 Codex:沙箱与代理原生可观测

5月7日 周四

4
工具发布·9 天前

Claude Code v2.1.133 发布,新增 worktree 分支策略与内存压力回收

工具发布·9 天前

Mozilla 借助 Claude Mythos 预览版将 Firefox 安全修复量提升至 423 个/月

工具发布·9 天前

Codex 0.129.0 发布:TUI 支持 Vim 模式与工作流恢复增强

系统与分布式·9 天前

从单智能体到多智能体:Ray Serve 架构演进实践

5月6日 周三

3
工具发布·10 天前

Claude Code v2.1.132 修复终端崩溃与粘贴异常等 14 项问题

工具发布·11 天前

Claude Code v2.1.129 发布:插件 URL 加载与 Homebrew 自动更新

大模型·11 天前

OpenAI 发布 B2B Signals 报告:前沿企业如何深化 AI 采纳

5月4日 周一

2
工具发布·12 天前

Claude Code v2.1.128 发布:MCP 工具计数、OTEL 隔离与插件 ZIP 支持

数据库·12 天前

Qonto 用 ClickHouse Cloud 重构可观测性:告别采样,两周查询窗口

5月1日 周五

1
工具发布·16 天前

Claude Code v2.1.126 发布:模型网关支持与项目状态清理

4月28日 周二

3
工具发布·18 天前

Claude Code v2.1.122 发布:支持 Bedrock 服务层级选择与多项修复

工具发布·19 天前

Claude Code v2.1.121 发布:MCP alwaysLoad、技能搜索与全屏交互改进

大模型·19 天前

OpenAI 模型与 Codex 登陆 AWS,企业可托管 AI Agent

4月27日 周一

1
工具发布·20 天前

OpenAI 开源 Codex 编排规范 Symphony

4月23日 周四

5
工具发布·23 天前

Claude Code v2.1.119 发布:设置持久化、GitLab PR 支持、OpenTelemetry 增强

大模型·23 天前

OpenAI 发布 GPT-5.5 系统卡,披露安全与能力评估

工具发布·24 天前

ClickHouse MCP 服务器接入 Google Antigravity,自然语言查数据库

工具发布·24 天前

Claude Code v2.1.118 发布:Vim 视觉模式、/usage 合并、MCP 钩子增强

大模型·24 天前

OpenAI 推出 Workspace Agents,Google 发布 Workspace Intelligence

4月22日 周三

3
推理引擎·24 天前

Google 发布两款专用 TPU 第八代芯片,面向 Agent 时代

系统与分布式·25 天前

Anyscale 推出 Agent Skills:基于 Ray 的 AI 工作负载调试与优化工具

工具发布·25 天前

Claude Code v2.1.117 发布:子代理分叉、bfs/ugrep 原生搜索、OpenTelemetry 增强

4月17日 周五

1
工具发布·29 天前

ClickHouse 开源 agentic CLI,加速 Postgres 应用接入 OLAP