论文速递·2 天前
数据溯源(provenance)在数据库查询解释和科学工作流审计中应用广泛,但细粒度溯源图随数据量超线性增长,在 Apache Flink 等流系统中扩展性差。本文提出 temporal attribution(时序归因),一种轻量级溯源形式,借鉴 Temporal Interaction Networks(TINs)对数据流算子间的量化数据交换进行建模,避免 tuple 级依赖元数据。作者将数据分为离散型和液态型,定义五种时序溯源查询类型,并提出基于状态的索引方法,旨在为大规模数据流分析提供实用工具。
论文速递·2 天前
现有 AI Agent 评测多聚焦于单文件或合成数据,缺乏对真实工作区中大规模文件依赖关系的评估。为此,研究者提出 Workspace-Bench,构建了包含 5 种工人画像、74 种文件类型、20,476 个文件(最大 20GB)的真实工作区,并设计了 388 个任务(共 7,399 条评分细则),每个任务附带文件依赖图,要求 Agent 完成跨文件检索、上下文推理与自适应决策。评测 4 种 Agent 框架与 7 个基础模型后发现,最佳 Agent 仅达约 60%,远低于人类 80.7%,平均仅 43.3%。同时提供 Workspace-Bench-Lite(100 任务子集),评测成本降低约 70%。
论文速递·2 天前
arXiv 论文提出 PersonalHomeBench,一个用于评估基础模型在个性化智能家居环境中作为 Agent 助手的基准测试。该基准通过迭代过程逐步构建丰富的家庭状态,生成个性化、上下文相关的任务,并提供 PersonalHomeTools 工具箱支持家庭信息检索、设备控制和情境理解。实验表明,随着任务复杂度增加,模型性能系统性下降,在反事实推理和部分可观测场景下失败明显,后者需要有效的工具调用来收集信息。
论文速递·2 天前
量子计算在数据管理中的应用日益受到关注,但量子设备的物理行为与数据库问题结构之间的关系尚不清晰。本文提出一个计算工具箱,从物理信息视角对数据管理问题导出的量子退火过程进行系统数值分析。该工具箱能够研究能隙、本征态结构等谱与动力学性质——这些性质无法通过直接硬件测量获得,但对理解计算难度和扩展行为至关重要。方法还提供导出量与可视化技术,支持优化动力学解读、与经典物理模型的结构相似性识别,以及降阶有效描述的构建。这项工作为评估量子方法并指导未来协同设计建立了原则性基础。
论文速递·2 天前
关系数据库中的多表归一化结构给深度神经网络带来挑战,现有方法依赖模式定义图,忽略元组属性中的隐式语义且连接僵化。本文提出检索增强建模(RAM)框架,将元组属性视为token,用随机游走构建上下文文档,通过信息检索估计语义相关性。在此基础上引入两种检索增强:ATRA利用表内相关性做对比学习,ETRA跨表链接语义相关元组增强图连通性。模型采用属性嵌入、特征融合和图聚合的分层架构。在五个真实关系数据库上,RAM在多种预测任务中一致超越现有基线。