每日早报
每天 5 分钟,看完工程圈昨日的关键信息
- 01
Ray Data LLM 发布,吞吐量达 vLLM 同步引擎两倍
Anyscale 发布 Ray Data LLM,一种面向生产级 LLM 推理的数据感知服务框架。在同等硬件条件下,其吞吐量达到 vLLM 同步引擎的 2 倍。
- 02
Valkey 9.1 登陆 ElastiCache,吞吐与隔离性双提升
Amazon ElastiCache 正式支持 Valkey 9.1,这是 Valkey 开源项目的最新社区版本,面向延迟敏感、高吞吐的内存工作负载。 Valkey 9.1 在吞吐量和内存效率上均有提升,并为多租户和共享集群部署提供了更强的隔离能力。新版本还引入了简化应用与运维流程的新命令,以及增强引擎可观测性的监控功能。 ElastiCache 以全托管服务形式持续跟进 Valkey 上游创新,用户无需自行管理集群即可获得最新社区特性。
- 03
Ray 2.56.0 发布:数据稳定性增强与 LLM 服务架构重构
Ray 2.56.0 正式发布,核心亮点包括 Ray Data 稳定性大幅提升、Ray Serve LLM 服务架构重构以及 GPU 域感知的放置组支持。 Ray Data 新增多数据集集群共存、自动 batch_size 选择与默认逻辑内存配置,减少 OOM 和对象存储溢出。Ray Serve LLM 将请求处理与 token 流式响应路径解耦,显著提升 LLM 推理性能;同时引入 ConsistentHashRouter 和 CapacityQueueRouter 两种新路由策略。 Ray Core 新增 GPU 域感知放置组(基于 ray.io/gpu-domain 标签),以及 Aut
- 04
ScyllaDB 2026.2 发布:向量搜索与 DynamoDB Streams 正式可用
ScyllaDB 2026.2 版本正式发布,带来多项 GA 与实验性功能。DynamoDB Streams 兼容和向量搜索(Vector Search)功能达到生产可用状态,Trie 索引与强一致性表作为实验特性首次亮相。
- 05
DiScoFormer: 单一Transformer同时建模密度与分数,跨分布泛化
艾伦人工智能研究所提出 DiScoFormer,一种能同时学习概率密度函数和评分函数的单一 Transformer 架构,在多个数据分布上实现零样本泛化。传统方法需要为每个分布单独训练一个模型,DiScoFormer 通过将分布上下文作为条件输入,让同一个模型处理未见过的分布。
- 06
Nova 2 Lite 做图文提取,Claude 做空间推理,双模型管线降本
AWS 在 Bedrock 上搭建双模型管线,用 Amazon Nova 2 Lite 做原生多模态图文提取,再交给 Claude Sonnet 4.6 做空间推理,完成扫描文档的数字化。Nova 2 Lite 单次调用即可检测照片、提取姓名及坐标、返回页面元数据;Claude 根据版面布局将姓名与面孔匹配。该方案在年刊扫描场景中验证了低成本、高精度的文档处理能力,适合大规模文档数字化工程。
- 07
AWS 三层架构实现多租户 LLM 分析系统的行级安全隔离
PAR 公司在 AWS 上构建了一套生产级多租户 LLM 分析系统,通过三层架构强制行级安全隔离,防止跨租户数据泄露。
- 08
Bedrock AgentCore 内置可观测性,调试生产 Agent 无限循环与工具调用失败
AWS 发布 Amazon Bedrock AgentCore 可观测性功能,帮助开发者调试生产环境中 AI Agent 的常见故障模式,包括无限循环和工具调用失败。这是该系列的第一篇,后续将覆盖性能优化与内存管理。
- 09
AWS FinTech 用 Neptune 图数据库建模企业资金层级
AWS 金融科技团队在博客中披露,他们使用 Amazon Neptune 图数据库建模企业 treasury 结构,包括法律实体关系、公司间协议和银行账户关联,以支撑支付路由和现金管理。 核心方案是将资金层级建模为属性图(property graph),利用 Neptune 的图遍历能力高效查询跨实体的资金链路和审批路径,替代传统关系型数据库中的多层 JOIN 查询。 该实践展示了图数据库在金融合规与资金调度场景中的工程价值,为同类系统设计提供了可参考的建模范式。
- 10
Securonix 迁移至 ElastiCache for Valkey 节省 20% 缓存成本
Securonix 将数百个 Amazon ElastiCache 集群从 Redis OSS 迁移至 Valkey,实现缓存成本降低 20%,年化节省超 10 万美元。