HBase組成架構

原創

2020-04-15 09:26

文章目錄

HBase組成

HBase架構

HBase組成

HBase主要有以下四大組件：Zookeeper（高可用、元數據的統一入口地址、管理HRegionServer）、HMaster（管理HRegionserver、維護集羣的元數據信息和負載均衡）、HRegionServer（真正“幹活”的節點）、HDFS（多副本底層數據存儲服務）

Zookeeper

HBase通過Zookeeper來做HA高可用,Zk保存HMaster的地址和backup-master地址，ZK能保證集羣中只有1個master在運行，如果master異常，會通過競爭機制選舉新的master。
Zookeeper管理HRegionServer,監控RegionServer的狀態、當RegionSevrer有異常的時候，通過回調的形式通知Master RegionServer上下限的信息。
Zookeeper存儲元數據的統一入口地址(znode:/hbase/meta-region-server)，這就說明zk很重要，把zk關掉你就不能讀取數據了。因爲你讀取數據所需要的元數據表在zk上。

HMaster

管理HRegionServer:爲RegionServer分配Region,當RegionSever失效的時候，協調對應Hlog的拆分,將失效的Region分配到正常的RegionServer上。
維護集羣的元數據信息，維護集羣負載均衡。

HRegionServer

直接對接來自客戶端的讀寫請求，是真正的“幹活”的節點，比如表的增刪改查數據，和HDFS交互，存取數據。
管理Master爲其分配的Region。
負責和底層HDFS的交互，存儲數據到HDFS。
負責Region變大以後的拆分。
負責Storefile的合併工作。

HDFS

HDFS爲HBase提供底層數據存儲服務，元數據和表數據都存儲在HDFS中，同時爲HBase提供高可用（Hlog存儲在HDFS）的支持。
HDFS數據多副本機制能保證HBase的高可靠性。

HBase架構

首先HBase中的Table是會分成Region的，比如，user表中有10條記錄，那麼可能前5條在一個Region中，後5條在另一個Region裏，類似於分區的概念，分佈式系統中到處可見分區，下篇會具體講解HBASE中的Region。
HMaster會爲HRegionServer分配Region,分配後Region落地到HRegionServer上,即圖中的HRegion。
HRegionServer除了由HRegion組成外，還有一個很重要的東西:Hlog。HBase所有涉及到數據的變更都會寫到HLog中。它的作用就是保證數據安全。當RegionServer出現問題的時候，能跟進Hlog來做數據恢復。
HRegion由store(memstore,storefile(hfile))組成。寫文件時並不直接寫入HDFS，而是先停留在MemStore緩衝區，達到一定的量再Flush到StoreFile中，StoreFile是存儲HFile的地方，而HFile是真正存儲數據的文件。

現在具體來講解這些組件：

MemStore

MemStore是內存緩衝區，HBase寫入數據的時候會先停留在MemStore中，達到一定的時候纔會刷盤到StoreFile中。
爲什麼要有MemStore的存在呢？

不需要立即寫入HDFS，先寫內存，內存滿了再寫HDFS。可以提高寫的性能
可以進行排序。HBase寫入到HDFS上的數據是需要按照RowKey進行排序的，而HBase是隨機的讀寫，因此HBase通過MemStore在持久化到HDFS之前完成排序，然後再快速的順序寫入HDFS。主要原理是LSM。
優化數據的存儲，比如一個記錄添加之後馬上被刪除了，在Flush的時候就可以直接不把這個數據寫到HDFS中。

爲什麼要達到一定的時候再刷盤？
那是爲了提高HBase的寫入性能，所以當寫請求寫入MemStore後，不會立即刷盤。那麼哪些場景會觸發刷盤的操作呢？總結如下：

Region級別的觸發刷寫
hbase.hregion.memstore.flush.size
當MemStore的大小達到hbase.hregion.memstore.flush.size大小的時候會觸發刷盤，默認128M。
全局內存控制
hbase.regionserver.global.memstore.size //在新的更新被阻止並強制flush之前，RegionServer的全部memstore最大值（默認爲堆內存的40%，直到RegionServer中的所有 memstore 的大小達到 hbase.regionserver.global.memstore.size.lower.limit，更新將被阻止並強制flush）
hbase.regionserver.global.memstore.size.lower.limit //強制刷新之前，RegionServer中所有memstore的最大大小（默認值爲：hbase.regionserver.global.memstore.size 的95%），當由於內存限制而導致更新被阻塞時，系統會以儘可能小的刷新量刷新數據）
舉例，比如你配置的hbase.regionserver.global.memstore.size.lower.limit=0.95 hbase.regionserver.global.memstore.size=0.4，堆內存總共是64G,那麼
觸發刷寫的閾值是：640.40.95=24.32
觸發阻塞的閾值是：64*0.4=25.6
HLog引發的刷盤
HLog中包含了所有已經寫入Memstore但還未Flush到HFile的更改。在Memstore中數據還沒有持久化，當RegionSever宕掉的時候，可以使用HLog恢復數據。可是當HLog很大的時候，恢復的時候就需要很長的時間。因此，對HLog的大小也有一些限制，當達到這些限制的時候，就會觸發Memstore的flush。Memstore flush會使HLog減少，因爲數據持久化之後(寫入到HFile)，就沒有必要在HLog中再保存這些修改了。有兩個屬性可以配置：
hbase.regionserver.hlog.blocksize//HLog塊大小
hbase.regionserver.maxlogs//HLog的最大個數
這兩個相乘就決定了hlog的最大大小。

HLog

HLog是HBase實現WAL（Write ahead log）方式產生的日誌信息，內部是一個簡單的順序日誌。每個RegionServer對應1個HLog(備註：1.x版本的可以開啓MultiWAL功能，允許多個HLog)，因此是多個Region對應同一個HLog。所有對於該RegionServer的寫入都被記錄到HLog中。HLog功能就是爲了保證數據安全。當RegionServer出現問題的時候，能跟進HLog來做數據恢復
數據到達Region是先寫入WAL然後再被加載到MemStore中的。
HLog持久化在HDFS之上, HLog存儲位置查看:

我們看到，有一個oldWAL目錄，這是啥？剛剛提到，爲了避免恢復的時候因爲HLog過大導致的效率低下，HLog過大時就會觸發強制刷盤操作。對於已經刷盤的數據，其對應的HLog會過期，過期的HLog會被移動到oldWAL。
HLog架構圖：

由圖可知，HLog=HLogkey+WALEdit。HLogkey=sequenceid+timestamp+cluster ids+regionname+tablename等組成，WALEdit是由一系列的KeyValue組成。
其中sequenceid非常重要，sequenceid是一個自增序列號，region的數據恢復和HLog過期清除都要依賴它。
HLog的過期依賴於對sequenceid的判斷。HBase會將HLog的sequenceid和HFile最大的sequenceid（刷新到的最新位置）進行比較，如果該HLog文件中的sequenceid比刷新的最新位置的sequenceid都要小，那麼這個HLog就過期了，過期了以後，對應HLog會被移動到oldWAL目錄。
當RegionServer出現故障的時候，需要對HLog進行回放來恢復數據。回放的時候會讀取HFile的sequenceid和HLog中的sequenceid進行比較，小於sequenceid的就直接忽略，大於等於的就進行重做。回放完成後，就完成了數據的恢復工作。舉例，HFile中sequenceid=10，HLog中sequenceid=15，1-10的在HFile中已經持久化了就不需要恢復了，那麼就是恢復11-15的數據。

如何打開和關閉WAL
默認是打開的。Mutation.setDurability(Durability.SKIP_WAL)可以關閉它。這樣可以讓數據操作快一點，但是最好不要這麼做，因爲當服務器宕機，數據會丟失。
WAL滾動
WAL是一個環狀的滾動日誌結構，這樣可以保證寫入效果最高並且保證空間不會持續變大。
觸發滾動的條件：

WAL的檢查間隔：hbase.regionserver.logroll.period。默認一小時，上面說了，通過sequenceid，把當前WAL的操作和HDFS對比，看哪些操作已經被持久化了。就被移動到oldWAL目錄中。
當WAL文件所在的塊block快要滿了
當WAL所佔的空間大於或者等於某個閾值（hbase.regionserver.hlog.blocksize乘hbase.regionserver.logroll.multiplier）blocksize是存儲系統的塊大小，如果你是基於HDFS只要設定爲HDFS的塊大小即可，multiplier是一個百分比，默認0.95，即WAL所佔的空間大於或者等於95%的塊大小，就被歸到oldWAL文件中。

oldWAL何時刪除
oldWAL什麼時候被徹底刪除呢？Master會定期的去清理這個文件，如果當這個WAL不需要作爲用來恢復數據的備份，那麼就可以刪除。兩種情況下，可能會引用WAL文件，此時不能刪除

TTL進程：該進程會保障WAL文件存活到hbase.master.logcleaner.ttl定義的超時時間爲止，默認10分鐘。
備份機制：如果你開啓了備份機制replication（把一個集羣的數據實時備份到裏另一個集羣），那麼HBASE要保障備份集羣已經完全不需要這個文件了。如果你手頭就一個集羣，那麼就不需要考慮這個文件了

StoreFile和HFile

StoreFile是對HFile進行了輕量級的包裝。HFile是實際數據的存儲。
HFile包括:

Data:數據塊
Meta：元數據塊
Fileinfo：文件信息
DataIndex：Data塊索引信息
MetaIndex：Meta塊索引信息
Trailer：存儲了Fileinfo Dataindex Metaindex的偏移值

本文轉載至：http://bigdata-star.com/archives/1175

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

學習必備——HBase和Zookeeper安裝

操作系統:centos7.4 chd的HBase發行版:hbase-1.2.0-cdh5.15.1 chd的Zookeeper發行版:zookeeper-3.4.5-cdh5.15.1.tar.gz 由於 HBase 是使用

爱做梦的锤子

2020-07-07 23:22:40

HBase概述（概念、數據模型、特點和優勢）

目錄HBase是什麼？HBase與RDBMS對比數據模型NameSpaceTableRow KeyColumns FamilyTimeStampCellHBase的特點 HBase是什麼？ HBase是一個高可靠性、高性能、面向

2020-07-07 14:12:54

HBase 增量備份

Author：Pirate Leo myBlog: http://blog.csdn.net/pirateleo/ myEmail: [email protected] 轉載請註明出處，謝謝。文中可能涉及到的API：

胡同里的民工

2020-07-07 09:10:55

HBase 超詳細優化

高可用在HBase中Hmaster負責監控RegionServer的生命週期，均衡RegionServer的負載，如果Hmaster掛掉了，那麼整個HBase集羣將陷入不健康的狀態，並且此時的工作狀態並不會維持太久。所以HBas

大数据小同学

2020-07-07 01:19:07

HBase擴展布隆過濾器

HBase在商業項目中的能力每天：消息量：發送和接收的消息數超過60億將近1000億條數據的讀寫高峯期每秒150萬左右操作整體讀取數據佔有約55%，寫入佔有45% 超過2PB的數據，涉及冗餘共6PB數據數據每月大概增

大数据小同学

2020-07-07 00:39:19

HBase詳細簡介

什麼是HBase HBase的原型是Google的BigTable論文，受到了該論文思想的啓發，目前作爲Hadoop的子項目來開發維護，用於支持結構化的數據存儲。官方網站：http://hbase.apache.org – 20

大数据小同学

2020-07-07 00:39:19

HBase詳細原理

讀流程 Client先訪問zookeeper，從meta表讀取region的位置，然後讀取meta表中的數據。meta中又存儲了用戶表的region信息；根據namespace、表名和rowkey在meta表中找到對應的re

大数据小同学

2020-07-07 00:39:19

HBase詳細安裝

Zookeeper正常部署首先保證Zookeeper集羣的正常部署，並啓動之： [liujh@hadoop102 zookeeper-3.4.10]$ bin/zkServer.sh start [liujh@hadoop103

大数据小同学

2020-07-07 00:39:19

HBase 詳細API操作

環境準備新建項目後在pom.xml中添加依賴： <dependency> <groupId>org.apache.hbase</groupId> <artifactId>hbase-server</artifac

大数据小同学

2020-07-07 00:39:19

HBase 與Hive的集成詳解

HBase與Hive的對比 Hive 數據倉庫 Hive的本質其實就相當於將HDFS中已經存儲的文件在Mysql中做了一個雙射關係，以方便使用HQL去管理查詢。用於數據分析、清洗 Hive適用於離線的數據分析和清洗，延遲較高。

大数据小同学

2020-07-07 00:39:19

HBase數據結構詳解

RowKey 與nosql數據庫們一樣,RowKey是用來檢索記錄的主鍵。訪問HBASE table中的行，只有三種方式：通過單個RowKey訪問(get) 通過RowKey的range（正則）(like) 全表掃描(scan

大数据小同学

2020-07-07 00:39:19

HBase MapReduce 詳解

通過HBase的相關JavaAPI，我們可以實現伴隨HBase操作的MapReduce過程，比如使用MapReduce將數據從本地文件系統導入到HBase的表中，比如我們從HBase中讀取一些原始數據後使用MapReduce做數據

大数据小同学

2020-07-07 00:39:19

HBase Shell詳細操作

基本操作進入HBase客戶端命令行 [liujh@hadoop102 hbase]$ bin/hbase shell 查看幫助命令 hbase(main):001:0> help 查看當前數據庫中有哪些表 hba

大数据小同学

2020-07-07 00:39:19

Spark讀寫HBase數據

1.使用Spark創建Hbase表，以及定義表屬性 object HBaseCreateTable { def main(args: Array[String]) { val TABLE_NAME = "test_yu

2020-07-07 00:11:09

數據倉庫 - 事實表開發實踐（IoT場景）

一、事實表分類 1. 以粒度劃分（1）事務事實表（Transaction Grain Fact Table）一條記錄代表了業務系統中的一個事件。事務出現後，就會在事實中出現一條記錄。以訂單域舉例：下單是一個事實；付款是一個事實；退款

2020-07-06 06:02:15

24小時熱門文章

最新文章

最新評論文章