Druid实时大数据笔记02 -架构

一,Druid架构预览

 1)实时节点 (realtime node): 实时摄入实时数据,以及生成Segment数据文件。

 2) 历史节点(Historical node): 加载已生成好的数据文件,以供数据查询。

 3) 查询节点 (broker node) : 对外提供数据查询服务,并同时从实时节点与历史节点查询数据,合并后返回给调用方。

 4)协调节点(Coordinator node): 负责历史节点的数据负载均衡,以及通过规则管理数据的生命周期。

同时集群需要以下三类的依赖:

元数据库:存储Druid集群的原数据信息,以及Segment的相关信息 一般用mysql 或 PostgreSQL

 备注,知识点:

1) 二叉查找树 

2)二叉平衡树

 

3) B+树 

B+树也是有缺点的:

最后出现了LSM-tree,Hbase就是使用的LMS-tree:

Druid的架构特点:

所以Druid的架构特点带来的显著优势:

Segment 是数据的实际屋里存储,是按时间范围去存储的,所以查询按时间查询是非常快的。

Druid的扩展:

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章