Hbase 之 HBase 的整體架構

原創

2020-07-08 00:38

HBase 系統架構圖

組成部件說明
　　Client：
　　使用HBase RPC機制與HMaster和HRegionServer進行通信
　　Client與HMaster進行通信進行管理類操作
　　Client與HRegionServer進行數據讀寫類操作
　　Zookeeper：
　　Zookeeper Quorum存儲-ROOT-表地址、HMaster地址
　　HRegionServer把自己以Ephedral方式註冊到Zookeeper中，HMaster隨時感知各個HRegionServer的健康狀況
　　Zookeeper避免HMaster單點問題
　　HMaster：
　　HMaster沒有單點問題，HBase中可以啓動多個HMaster，通過Zookeeper的Master Election機制保證總有一個Master在運行
　　主要負責Table和Region的管理工作：
　　1 管理用戶對錶的增刪改查操作
　　2 管理HRegionServer的負載均衡，調整Region分佈
　　3 Region Split後，負責新Region的分佈
　　4 在HRegionServer停機後，負責失效HRegionServer上Region遷移
　　HRegionServer：
　　HBase中最核心的模塊，主要負責響應用戶I/O請求，向HDFS文件系統中讀寫數據

　　

　　HRegionServer管理一些列HRegion對象；
　　每個HRegion對應Table中一個Region，HRegion由多個HStore組成；
　　每個HStore對應Table中一個Column Family的存儲；
　　Column Family就是一個集中的存儲單元，故將具有相同IO特性的Column放在一個Column Family會更高效

　　HStore：
　　HBase存儲的核心。由MemStore和StoreFile組成。
　　MemStore是Sorted Memory Buffer。用戶寫入數據的流程：

　　

　　Client寫入 -> 存入MemStore，一直到MemStore滿 -> Flush成一個StoreFile，直至增長到一定閾值 -> 觸發Compact合併操作 -> 多個StoreFile合併成一個StoreFile，同時進行版本合併和數據刪除 -> 當StoreFiles Compact後，逐步形成越來越大的StoreFile -> 單個StoreFile大小超過一定閾值後，觸發Split操作，把當前Region Split成2個Region，Region會下線，新Split出的2個孩子Region會被HMaster分配到相應的HRegionServer上，使得原先1個Region的壓力得以分流到2個Region上。
由此過程可知，HBase只是增加數據，有所得更新和刪除操作，都是在Compact階段做的，所以，用戶寫操作只需要進入到內存即可立即返回，從而保證I/O高性能。

　　HLog
　　引入HLog原因：
　　在分佈式系統環境中，無法避免系統出錯或者宕機，一旦HRegionServer意外退出，MemStore中的內存數據就會丟失，引入HLog就是防止這種情況
　　工作機制：
　　每個HRegionServer中都會有一個HLog對象，HLog是一個實現Write Ahead Log的類，每次用戶操作寫入Memstore的同時，也會寫一份數據到HLog文件，HLog文件定期會滾動出新，並刪除舊的文件(已持久化到StoreFile中的數據)。當HRegionServer意外終止後，HMaster會通過Zookeeper感知，HMaster首先處理遺留的HLog文件，將不同region的log數據拆分，分別放到相應region目錄下，然後再將失效的region重新分配，領取到這些region的HRegionServer在Load Region的過程中，會發現有歷史HLog需要處理，因此會Replay HLog中的數據到MemStore中，然後flush到StoreFiles，完成數據恢復。

　　HBase存儲格式
　　HBase中的所有數據文件都存儲在Hadoop HDFS文件系統上，格式主要有兩種：
　　1 HFile HBase中KeyValue數據的存儲格式，HFile是Hadoop的二進制格式文件，實際上StoreFile就是對HFile做了輕量級包裝，即StoreFile底層就是HFile
　　2 HLog File，HBase中WAL（Write Ahead Log）的存儲格式，物理上是Hadoop的Sequence File

　　HFile

　　

　　圖片解釋：
　　HFile文件不定長，長度固定的塊只有兩個：Trailer和FileInfo
　　Trailer中指針指向其他數據塊的起始點
　　File Info中記錄了文件的一些Meta信息，例如：AVG_KEY_LEN, AVG_VALUE_LEN, LAST_KEY, COMPARATOR, MAX_SEQ_ID_KEY等
　　Data Index和Meta Index塊記錄了每個Data塊和Meta塊的起始點
　　Data Block是HBase I/O的基本單元，爲了提高效率，HRegionServer中有基於LRU的Block Cache機制
　　每個Data塊的大小可以在創建一個Table的時候通過參數指定，大號的Block有利於順序Scan，小號Block利於隨機查詢
　　每個Data塊除了開頭的Magic以外就是一個個KeyValue對拼接而成, Magic內容就是一些隨機數字，目的是防止數據損壞

　　HFile裏面的每個KeyValue對就是一個簡單的byte數組。這個byte數組裏麪包含了很多項，並且有固定的結構。

　　

　　KeyLength和ValueLength：兩個固定的長度，分別代表Key和Value的長度
　　Key部分：Row Length是固定長度的數值，表示RowKey的長度，Row 就是RowKey
　　Column Family Length是固定長度的數值，表示Family的長度
　　接着就是Column Family，再接着是Qualifier，然後是兩個固定長度的數值，表示Time Stamp和Key Type（Put/Delete）
　　Value部分沒有這麼複雜的結構，就是純粹的二進制數據

　　HLog File

　　

　　HLog文件就是一個普通的Hadoop Sequence File，Sequence File 的Key是HLogKey對象，HLogKey中記錄了寫入數據的歸屬信息，除了table和region名字外，同時還包括 sequence number和timestamp，timestamp是“寫入時間”，sequence number的起始值爲0，或者是最近一次存入文件系統中sequence number。
　　HLog Sequece File的Value是HBase的KeyValue對象，即對應HFile中的KeyValue 。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

MySQL死鎖排查，原來我一直沒懂。。。

喜大普奔，微信給我的公衆號開了留言功能！！！有緣看到這篇文章的朋友，可以留個言互動下，謝謝～最近線上偶發MySQL的死鎖異常，發現原來很多理論都只背了個結論，細節都是魔鬼。比如，MySQL在RR級別用gap lock防止幻讀，

2024-04-23 23:10:58

倒排索引關鍵點普及

倒排索引倒排索引是什麼？爲什麼es、hbase、doris、starrocks都有倒排索引？倒排索引（英文：Inverted Index），是一種索引方法，常被用於全文檢索系統中的一種單詞文檔映射結構。現代搜索引擎絕大多數的索引都是基

2024-03-21 00:14:06

究竟什麼樣的數據庫，才能承接RTA廣告這個技術活！

本文分享自華爲雲社區《究竟什麼樣的數據庫，才能承接RTA廣告這個技術活！》，作者： GaussDB 數據庫。廣告投放費錢效果差，該如何解？廣告投放是企業宣傳營銷不可或缺的一部分。尤其是在新媒體發展白熱化的當下，不僅廣告渠道多樣化，投放

2024-03-20 10:55:19

菜鳥+Hologres=智能物流

作者：阿里巴巴菜鳥物流團隊（棄疾，孝江，姜繼忠）一、業務背景菜鳥智能物流分析引擎是基於搜索架構建設的物流查詢平臺，日均處理包裹事件幾十億，承載了菜鳥物流數據的大部分處理任務。智能物流分析引擎將基於運配網絡的各類應用場景集中到了統一的一

雲棲號資訊小編

2020-08-17 11:25:47

有哪些大數據處理工具？

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！阿里妹導讀：近幾年裏，大數據行業發展勢頭迅猛，故而相應的分佈式產品和架構層出不窮，本文分享作者在大數據系統實踐過程中接觸過的一些工具及使

雲棲號資訊小編

2020-07-22 12:37:48

dataX從mysql導出數據到hbase

業務數據庫中存了大量的歷史數據，導致在根據業務條件查詢數據的時候效率太低。因此考慮將原始的業務數據通過SQL先做一遍處理後放到中間表，然後再把中間表的數據同步到hbase，以後直接從hbase查詢數據。當然這個還涉及到增量數據如何同步，如

2020-07-08 10:43:37

hbase2.1.6 mr

1.hbase配置mapreduce依賴包編輯Hadoop的hadoop-env.sh文件 2.重啓hbase和Hadoop 上面配置爲hadoop-env.sh後，需要重啓才能生效。 3.在HBASE_HOME下運行命令即可 /v

2020-07-08 10:43:37

hbase2.1.6協處理器使用

對於2.1.6這個版本，使用協處理器需要引入hbase-common依賴。協處理器分爲兩種，一種是observer協處理器，一種是endpoint協處理器。下面首先記錄第一種協處理器的使用步驟。一、observer協處理器案例背景

2020-07-08 10:43:36

hbase爲什麼能夠實現實時讀寫

首先，需要明確的是，Hbase寫入速度比讀取速度要快，根本原因LSM存儲引擎 Hbase底層的存儲引擎爲LSM-Tree(Log-Structured Merge-Tree)。 LSM核心思想的核心就是放棄部分讀能力，換取寫入的最大化能力

2020-07-08 10:43:36

僞分佈Hadoop2.7.6 hbase2.1.8升級到Hadoop3.1.3 hbase2.1.10

如果Hadoop集羣配置了高可用，則可以進行不停服的滾動升級。但現在是僞分佈的單節點集羣，因此需要停止Hadoop及相關的應用，包括hbase、zookeeper等。 Hadoop升級因爲目前有跑flink作業，checkpoint是放

2020-07-08 10:43:24

hbase環境搭建及使用

conf/hbase-env.sh export JAVA_HOME=/data/home/software/jdk1.8.0_202 export HBASE_MANAGES_ZK=false hbase-site.xml <con

fanghailiang2016

2020-07-08 10:12:20

淘寶海量數據產品技術架構

轉自： http://blog.csdn.net/smarttony/article/details/6667944 淘寶數據魔方技術架構解析淘寶網擁有國內最具商業價值的海量數據。截至當前，每天有超過30億的店鋪、商品瀏覽記錄，

迷失的小书童

2020-07-07 20:59:04

巔峯對決：Hypertable(C++)吞吐率測試完勝HBase(Java)

導讀：衆所周知，2006年Google公佈了自己的BigTable論文，作爲Google繼GFS和MapReduce兩項創新之後的又一項創新，其在設計用來針對海量數據處理情形下的管理結構型數據方面具有着巨大的技術優勢。而Hypertabl

2020-07-07 15:10:10

Java操作Hbase

import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.h

2020-07-07 14:03:40

phoenix 安裝教程

phoenix 概述 phoenix，中文譯爲“鳳凰”，很美的名字。Phoenix是由saleforce.com開源的一個項目，後又捐給了Apache基金會。它相當於一個Java中間件，提供jdbc連接，操作hbase數據表。安

2020-07-07 13:38:47

24小時熱門文章

最新文章

最新評論文章