一,Druid架構預覽
1)實時節點 (realtime node): 實時攝入實時數據,以及生成Segment數據文件。
2) 歷史節點(Historical node): 加載已生成好的數據文件,以供數據查詢。
3) 查詢節點 (broker node) : 對外提供數據查詢服務,並同時從實時節點與歷史節點查詢數據,合併後返回給調用方。
4)協調節點(Coordinator node): 負責歷史節點的數據負載均衡,以及通過規則管理數據的生命週期。
同時集羣需要以下三類的依賴:
元數據庫:存儲Druid集羣的原數據信息,以及Segment的相關信息 一般用mysql 或 PostgreSQL
備註,知識點:
1) 二叉查找樹
2)二叉平衡樹
3) B+樹
B+樹也是有缺點的:
最後出現了LSM-tree,Hbase就是使用的LMS-tree:
Druid的架構特點:
所以Druid的架構特點帶來的顯著優勢:
Segment 是數據的實際屋裏存儲,是按時間範圍去存儲的,所以查詢按時間查詢是非常快的。
Druid的擴展: