開發者 | ClickHouse Inc 及 ClickHouse開源社區 |
---|---|
首次发布 | 2016年6月15日 |
当前版本 | |
源代码库 | |
编程语言 | C++ |
操作系统 | Linux, macOS |
许可协议 | Apache License 2.0 |
网站 | clickhouse |
ClickHouse是一个用于線上分析處理(OLAP)的开源列式数据库。
ClickHouse是由俄罗斯IT公司Yandex为Yandex.Metrica网络分析服务开发的。[3][4][5][6] ClickHouse允许分析实时更新的数据。该系统以高性能为目标。[7]
这个项目是在2016年6月发布的Apache许可证下的开源软件。[8]
Yandex.Tank负载测试工具使用ClickHouse。[8] Yandex.Market使用ClickHouse来监控网站的可访问性和KPI。[9] ClickHouse还在CERN的LHCb实验[10]中实现了对100亿个事件的元数据进行存储和处理,每个事件有超过1000个属性,Tinkoff Bank使用ClickHouse作为项目的数据存储。[11]
Yandex.Metrica以前使用一种经典的方法,即以聚合形式存储原始数据。[12] 这种方法可以帮助减少存储的数据量。然而,它有几个局限性和缺点:
另一种方法是存储未聚合的数据。处理原始数据需要高性能的系统,因为所有计算都是实时进行的。为了解决这个问题,需要一个能够处理整个互联网规模的分析数据的列式数据库。Yandex开始开发自己的列式数据库。 ClickHouse的第一个原型在2009年出现。2014年底,Yandex.Metrica 2.0版发布。新版本有一个用于创建自定义报告的接口,并使用ClickHouse存储和处理数据。
ClickHouse Inc.於2021年9月在加州舊金山成立,以持續發展ClickHouse;最初由Index Ventures、Benchmark Capital和Yandex共投資 5000 萬美元。2021年10月Coatue Management、Altimeter Capital等B輪融資2.5億美元,使公司估值達20億美元。直至2023年ClickHouse Inc員工人數為120人。
Clickhouse DBMS 的主要功能是:[13]
Clickhouse有一些可以被视为缺点的特点:
ClickHouse的一个常见情况是服务器日志分析。在将常规数据上传到ClickHouse之后(建议将数据每次1000条以上批量插入),就可以通过即时查询分析事件或监视服务的指标,如错误率、响应时间等。
ClickHouse还可以用作内部分析师的内部数据仓库。ClickHouse可以存储来自不同系统的数据(比如Hadoop或某些日志),分析人员可以使用这些数据构建内部指示板,或者为了业务目的执行实时分析。
根据开发人员进行的基准测试,[14] 对于OLAP查询,ClickHouse的速度比Hive(基于Hadoop技术栈的DBMS)或MySQL(通用RDBMS)快100倍以上。