← 返回信息流
数据库·更新于 2026/05/04 00:00

DuckLake 规范发布:用简单接口统一数据湖与 DataFrame

DuckDB 团队发布 DuckLake 规范,旨在为数据湖(Data Lake)上的 DataFrame 操作定义一套极简的开放接口。核心思路是将文件格式(Parquet/CSV/JSON)、分区发现、谓词下推、统计信息等底层细节抽象为统一协议,使得任何引擎(DuckDB、Polars、Pandas 等)都能基于同一套规范读写湖上数据,而无需各自实现全套湖格式兼容。规范本身仅定义元数据发现与数据访问两个核心接口,强调"简单到连 Clanker 都能实现"。

速读

DuckDB发布DuckLake规范,通过统一元数据发现与数据访问接口降低数据湖接入门槛

相关源 (1)