- Druid是一个
快速
的列式分布式
的支持实时分析
的数据存储系统。在处理PB级别数据、毫秒级延迟、数据实时处理方面
,比传统的OLAP系统有显著的性能改进。 列式存储格式
,Druid使用面向列的存储,只需要加载特定查询所需的列,查询速度快可扩展的分布式系统
,Druid通常部署在数十到数百台服务器的集群中,并且提供数百万条/秒的摄取率,保留数百万条记录,以及亚秒级到几秒钟的查询延迟。大规模的并行处理
,Druid可以在整个集群中进行大规模的并行查询。实时或批量摄取
,Druid可以实时摄取数据(实时获取的数据可立即用于查询)或批量处理数据。自愈,自平衡,易操作
,集群扩展和缩小,只需添加或删除服务器,集群将在后台自动重新平衡,无需任何停机时间。- 数据进行了有效的
预聚合或预计算
,查询速度快。 - 数据的结果应用在Bitmap压缩算法
- 适用于清洗好的记录实时录入,但不需要更新操作。
- 适用于支持宽表,不用Join的方式,单表操作。
- 适用于可以总结出基础的统计指标,一个字段表示。
- 适用于实时性要求高的场景。
- 适用于对数据质量的敏感度不高的场景。