每日早报

每天 5 分钟,看完工程圈昨日的关键信息

2026.06.30星期二

01
Ray Data LLM 发布，吞吐量达 vLLM 同步引擎两倍
Anyscale 发布 Ray Data LLM，一种面向生产级 LLM 推理的数据感知服务框架。在同等硬件条件下，其吞吐量达到 vLLM 同步引擎的 2 倍。
02
Valkey 9.1 登陆 ElastiCache，吞吐与隔离性双提升
Amazon ElastiCache 正式支持 Valkey 9.1，这是 Valkey 开源项目的最新社区版本，面向延迟敏感、高吞吐的内存工作负载。 Valkey 9.1 在吞吐量和内存效率上均有提升，并为多租户和共享集群部署提供了更强的隔离能力。新版本还引入了简化应用与运维流程的新命令，以及增强引擎可观测性的监控功能。 ElastiCache 以全托管服务形式持续跟进 Valkey 上游创新，用户无需自行管理集群即可获得最新社区特性。
03
Ray 2.56.0 发布：数据稳定性增强与 LLM 服务架构重构
Ray 2.56.0 正式发布，核心亮点包括 Ray Data 稳定性大幅提升、Ray Serve LLM 服务架构重构以及 GPU 域感知的放置组支持。 Ray Data 新增多数据集集群共存、自动 batch_size 选择与默认逻辑内存配置，减少 OOM 和对象存储溢出。Ray Serve LLM 将请求处理与 token 流式响应路径解耦，显著提升 LLM 推理性能；同时引入 ConsistentHashRouter 和 CapacityQueueRouter 两种新路由策略。 Ray Core 新增 GPU 域感知放置组（基于 ray.io/gpu-domain 标签），以及 Aut
04
ScyllaDB 2026.2 发布：向量搜索与 DynamoDB Streams 正式可用
ScyllaDB 2026.2 版本正式发布，带来多项 GA 与实验性功能。DynamoDB Streams 兼容和向量搜索（Vector Search）功能达到生产可用状态，Trie 索引与强一致性表作为实验特性首次亮相。
05
DiScoFormer: 单一Transformer同时建模密度与分数,跨分布泛化
艾伦人工智能研究所提出 DiScoFormer，一种能同时学习概率密度函数和评分函数的单一 Transformer 架构，在多个数据分布上实现零样本泛化。传统方法需要为每个分布单独训练一个模型，DiScoFormer 通过将分布上下文作为条件输入，让同一个模型处理未见过的分布。
06
Nova 2 Lite 做图文提取,Claude 做空间推理,双模型管线降本
AWS 在 Bedrock 上搭建双模型管线,用 Amazon Nova 2 Lite 做原生多模态图文提取,再交给 Claude Sonnet 4.6 做空间推理,完成扫描文档的数字化。Nova 2 Lite 单次调用即可检测照片、提取姓名及坐标、返回页面元数据;Claude 根据版面布局将姓名与面孔匹配。该方案在年刊扫描场景中验证了低成本、高精度的文档处理能力,适合大规模文档数字化工程。
07
AWS 三层架构实现多租户 LLM 分析系统的行级安全隔离
PAR 公司在 AWS 上构建了一套生产级多租户 LLM 分析系统，通过三层架构强制行级安全隔离，防止跨租户数据泄露。
08
Bedrock AgentCore 内置可观测性，调试生产 Agent 无限循环与工具调用失败
AWS 发布 Amazon Bedrock AgentCore 可观测性功能，帮助开发者调试生产环境中 AI Agent 的常见故障模式，包括无限循环和工具调用失败。这是该系列的第一篇，后续将覆盖性能优化与内存管理。
09
AWS FinTech 用 Neptune 图数据库建模企业资金层级
AWS 金融科技团队在博客中披露，他们使用 Amazon Neptune 图数据库建模企业 treasury 结构，包括法律实体关系、公司间协议和银行账户关联，以支撑支付路由和现金管理。核心方案是将资金层级建模为属性图（property graph），利用 Neptune 的图遍历能力高效查询跨实体的资金链路和审批路径，替代传统关系型数据库中的多层 JOIN 查询。该实践展示了图数据库在金融合规与资金调度场景中的工程价值，为同类系统设计提供了可参考的建模范式。
10
Securonix 迁移至 ElastiCache for Valkey 节省 20% 缓存成本
Securonix 将数百个 Amazon ElastiCache 集群从 Redis OSS 迁移至 Valkey，实现缓存成本降低 20%，年化节省超 10 万美元。