数据库 · 29 天前
ClickHouse 宣布原生集成 Apache Iceberg 等开放表格式,用户可直接查询 Iceberg 表、将 ClickHouse 数据写入 Iceberg,并在 Iceberg、Delta Lake、Hudi 之间做联邦查询。技术核心包括:利用 Iceberg 的 manifest 和 manifest list 实现分区裁剪与谓词下推,避免全表扫描;通过 Parquet 列存格式对齐 ClickHouse 向量化执行引擎,减少序列化开销;未来路线图计划支持 Iceberg REST Catalog、表维护(compaction、snapshot 过期)以及更深的统计信息集成以提升查询剪枝效率。
› 1 条相关源
数据库 · 29 天前
ClickHouse Cloud 发布 Warehouses 功能,在已有存储-计算分离架构之上进一步实现计算-计算分离(compute-compute separation)。每个 Warehouse 是一组独立计算节点,可绑定特定租户或工作负载,共享同一对象存储中的数据。核心机制是计算节点之间通过共享元数据层协调数据可见性,写入在一个 Warehouse 完成后,其他 Warehouse 通过元数据刷新即可读取最新数据,无需跨 Warehouse 拷贝数据。该方案帮助用户实现租户隔离、资源独立扩缩容,并优化整体资源利用率与成本。
› 1 条相关源
数据库 · 29 天前
ClickHouse 官方博客发布了一项 JOIN 性能对比测试,选取 Databricks 和 Snowflake 公开的 JOIN 密集型 SQL 基准查询,在 ClickHouse Cloud 上原样运行。测试数据规模从 7.21 亿行到 72 亿行,ClickHouse 在所有规模下均比竞品更快且成本更低。这是系列文章的第一篇,后续会深入分析具体优化手段。
› 1 条相关源
数据库 · 2026/4/17
ClickHouse 官方博客发布了一篇从 Postgres 迁移到 ClickHouse 的数据建模指南。文章重点介绍了 ReplacingMergeTree 引擎在去重场景下的使用方式,以及如何通过合理的 Ordering Key 和 PRIMARY KEY 策略来优化查询性能。核心思路是将 Postgres 的 OLTP 行存模型转换为 ClickHouse 的 OLAP 列存模型,利用排序键替代传统 B-Tree 索引来加速范围查询与聚合。
› 1 条相关源
工具发布 · 2026/4/17
ClickHouse 发布开源命令行工具 clickhouse.build,专为已有 Postgres 后端 TypeScript 应用设计,旨在降低引入 ClickHouse 做分析查询的门槛。该 CLI 通过 agentic 方式自动识别 Postgres 中的慢查询或分析型负载,生成迁移建议并配置 ClickHouse 数据同步,开发者无需手动编写 ETL 或修改应用代码。
› 1 条相关源
数据库 · 2026/4/17
Polymarket 将计算密集型分析工作负载从 PostgreSQL 迁移到 ClickHouse,以支撑用户侧实时功能。迁移后,原本需要数秒的复杂聚合查询降至毫秒级,同时释放了 PG 的 OLTP 能力。文章详细描述了数据管道架构:PostgreSQL 通过 PeerDB 实时 CDC 同步到 ClickHouse,再通过 ClickHouse 物化视图预聚合,最终由 API 层直接查询物化视图返回给前端。关键设计包括使用 ReplacingMergeTree 处理去重、利用 AggregatingMergeTree 做增量聚合,以及通过 ClickHouse 的极简 SQL 语法实现复杂漏斗分析。
› 1 条相关源
数据库 · 2026/4/17
Common Room 是一家 AI 客户智能平台,将其客户门户的实时分析引擎从 PostgreSQL 迁移至 ClickHouse。迁移后,查询性能显著提升,能够支撑更复杂的实时聚合与多维分析场景。核心替换逻辑是将原先 Postgres 中通过物化视图、索引和查询优化来勉强支撑的 OLAP 负载,直接交由列式存储 + 向量化执行的 ClickHouse 处理,消除了大量维护成本和查询延迟瓶颈。
› 1 条相关源
数据库 · 2026/4/17
ClickHouse 官方博客介绍如何优化 JSON 数据查询,使仪表盘响应时间稳定在 100ms 以下,即使表中包含数十亿 JSON 文档。核心技术是使用物化路径(materialized path)将 JSON 字段映射为列式存储中的扁平列,避免每次查询时解析 JSON 的开销。文章还讨论了如何利用 ClickHouse 的物化列(materialized columns)和投影(projections)来预计算常用 JSON 路径,从而在写入时完成解析,查询时直接读取预计算列。
› 1 条相关源
数据库 · 2026/4/17
印度初创公司 Auditzy 因 Postgres 性能瓶颈,将核心分析查询迁移至 ClickHouse。迁移后查询速度提升 33 倍,数据压缩率提高 10 倍。ClickHouse 的列式存储与向量化执行引擎是提速关键,而 Postgres 在 OLAP 场景下因行式存储和缺乏向量化导致 I/O 与 CPU 效率低下。
› 1 条相关源