Druid實時大數據筆記02 -架構

一,Druid架構預覽

 1)實時節點 (realtime node): 實時攝入實時數據,以及生成Segment數據文件。

 2) 歷史節點(Historical node): 加載已生成好的數據文件,以供數據查詢。

 3) 查詢節點 (broker node) : 對外提供數據查詢服務,並同時從實時節點與歷史節點查詢數據,合併後返回給調用方。

 4)協調節點(Coordinator node): 負責歷史節點的數據負載均衡,以及通過規則管理數據的生命週期。

同時集羣需要以下三類的依賴:

元數據庫:存儲Druid集羣的原數據信息,以及Segment的相關信息 一般用mysql 或 PostgreSQL

 備註,知識點:

1) 二叉查找樹 

2)二叉平衡樹

 

3) B+樹 

B+樹也是有缺點的:

最後出現了LSM-tree,Hbase就是使用的LMS-tree:

Druid的架構特點:

所以Druid的架構特點帶來的顯著優勢:

Segment 是數據的實際屋裏存儲,是按時間範圍去存儲的,所以查詢按時間查詢是非常快的。

Druid的擴展:

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章