HBase基本架構:
RegionServer的作用
Data (某一行或者幾行數據的操作):get, put, delete (查、增、刪,改是通過時間戳timestamp控制的)
Region (相當於水平分表): splitRegion(切分), compactRegion(合併)
Master的作用:
Table:create, delete, alter
RegionServer: 分配regions到每個RegionServer,監控每個RegionServer的狀態。
注意:Mater掛掉的一段時間裏面,對數據的增刪改查,沒問題;對錶的操作,不能夠了!
也就是說Master其實管兩件事情:
1)Master管理的DDL操作,不管DML的事情。
2)Master根據負載情況,決定把數據給哪個region(region XXX),即當前表給誰維護。
Master存在單點故障。所以需要高可用。
(Hadoop1.0不帶高可用,Hadoop2.0可以高可用但是相對比較麻煩,Hadoop3.0自帶高可用)
RegionServer管理DML操作,直接和數據操作。
搭建HBase環境需要啓動的清單:
1)Zookeeper
2)Master
3)RegionServer
4)HDFS
Yarn可以不啓動。因爲這部分和Yarn沒關係,Yarn是調度資源做計算的,而HBase這裏是做存儲的,和計算無關所以不需要Yarn。
架構進階(沒寫完,改天寫)
HLog
WAL 預寫入日誌