網易加小米多位頂級工程師傾力打造出:HBase原理與實踐筆記

HBase項目自2006年提交第一行代碼以來,經歷了13年的蓬勃發展。現在已經有大量企業採用HBase來存儲和分析飛速增長的業務數據。從全球範圍來看,國內HBase的關注度更是高居榜首,這得益於國內互聯網、移動互聯網、物聯網等領域龐大的數據體量。

截至2019年8月,HBase全球社區已經擁有了83位HBase Committer,而國內就有20位左右的Committer,佔了近1/4的比例1。近一兩年,HBase在國內更是得到了長足的發展,2018年中國HBase技術社區成立,一年時間裏社區在多個城市相繼組織了9次線下技術沙龍活動,爲HBase更好地在國內各公司茁壯成長做出了卓越的貢獻。

我們和社區用戶多次交流後發現,很多人都希望我們能推薦一本HBase的書。當前市面上有關HBase的書籍大部分都集中於如何使用HBase,例如部署HBase集羣,使用客戶端API進行讀寫操作以及協處理器等,誠然,這些內容對快速掌握和使用HBase非常有好處,但是許多HBase使用者並不滿足於此,他們更希望能瞭解和掌握其內部運行原理。因此,當機械工業出版社的吳怡編輯詢問我們是否有想法爲HBase寫一本書時,我們毫不猶豫地答應了。

本書從設計的角度對HBase的整個體系架構和各核心組件進行系統的分析和講解。與此同時,還介紹常用的性能調優策略以及問題診斷的方法和技巧,幫助讀者更好地在實際生產環境中實踐。另外,本書最後章節集中介紹HBase 2.x版本的核心特性,例如Procedure v2、In Memory Compaction以及MOB等。

目錄

需要獲取這份資料的小夥伴可以直接轉發+關注後私信(學習)即可獲取!

本書共有16章,可以分爲6個部分:

第一部分:HBase基礎部分,包含第1、2章。其中,第1章主要介紹HBase系統的發展歷史、數據模型以及體系結構,第2章主要介紹HBase系統中常用的數據結構以及基礎算法。

第1章Hase概述

第2章基礎數據結構與算法

第二部分:HBase系統相關組件,包含第3、4、5章。其中,第3章重點介紹HBase所依賴的核心組件,包括ZooKeeper、HDFS等,第4章介紹HBase客戶端組件實現,第5章介紹RegionServer內部組件的實現。

第3章Hase依賴服務

第4章HBase客戶端

第5章RegionServer的核心模塊

第三部分:HBase核心工作原理,包含第6、7、8、9、10、11章。其中,第6章詳細分析HBase讀寫流程,第7章介紹HBase Compaction的實現原理,第8章介紹HBase中Region的遷移、合併以及分裂等操作是如何實現的,第9章介紹RegionServer宕機後如何通過HLog進行數據恢復,第10章介紹HBase不同集羣之間的複製是如何實現的,第11章介紹HBase如何通過Snapshot機制完成數據的備份和恢復。

第6章HBase讀寫流程

第7章Compaction實現

第8章負載均衡實現

第9章宕機恢復原理

第10章複製

第11章備份與恢復

第四部分:HBase運維調優實踐,包含第12、13、14章。其中,第12章介紹HBase集羣常用的運維管理操作,包括集羣如何有效監控,基準性能如何測試等,第13章集中介紹HBase集羣的常用調優技巧,第14章重點分析幾個HBase實際運維案例,通過案例分析介紹HBase集羣定位和處理問題的技巧。

第12章HBase運維

第13章HBase系統調優

第14章HBase運維案例分析

第五部分:HBase 2.x核心特性(第15章),介紹HBase最新2.x版本的核心功能與特性。

第15章HBase 2.x核心技術

第六部分:HBase高級話題(第16章),介紹社區中比較熱門的二級索引話題,以及HBase內核的開發與測試。

第16章高級話題

本書的六個部分都是相互獨立的話題,讀者完全可以從書中任何一個部分開始閱讀。當然,如果你想更加系統地學習HBase,建議你從前往後逐章閱讀。需要獲取的小夥伴可以直接轉發+關注後私信(學習)即可免費獲取!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章