聊起 BigTable，讓你不再膽怯

原創

2020-02-21 23:04

【這是一猿小講的第 66 篇原創分享】

谷歌“三駕馬車”的出現，才真正把我們帶入了大數據時代，並指明瞭大數據的發展方向。

GFS 作爲其中一駕寶車，解決了大數據存儲的難題。它能夠把大量廉價的普通機器，聚在一起，充分讓每臺廉價的機器發揮光和熱。其中在《從谷歌 GFS 架構設計聊開去》中我們針對 GFS 進行了管中窺豹，體會到其中一斑，不得不說是人多力量大，團結就是力量的體現。

MapReduce 作爲其中一座寶駕出現，主要解決海量數據計算的頭痛難題。在《悟懂MapReduce，不糾結！》中我們引入一個接地氣的“農村掰玉米”的案例進行了 MapReduce 思想的體會，大體意思是說， Map 就像人手掰一壠玉米（有個別生玉米+多數熟玉米），負責掰就行；Reduce 就像有專門收生玉米的；有專門收熟玉米的，然後各自進行彙總統計。

簡單去講，GFS 解決了分佈式文件的存儲，MapReduce 解決了海量數據的計算。

但是天生好奇，心生疑問“實時在線應用的海量結構化數據該如何存儲呢？”那麼不得不提及谷歌的第三駕馬車“BigTable”。

背景？

衆所周知，Google 要存儲海量的網頁，而且要能夠存儲一個 URL 的不同時期的多個版本的網頁內容（因爲網頁會不斷的更新，所以爬蟲也要不斷的針對同一個 URL 進行爬取）。

上圖是摘自 BigTable 的論文，老圖配新曲，在此處主要用來闡述 BigTable 產生的其中一個背景，從中我們能夠得出如下公式。

com.cnn.www + contents: + t3 => html網頁內容

com.cnn.www + contents: + t5 => html網頁內容

com.cnn.www + contents: + t6 => html網頁內容

那麼 Google 就需要設計一款類似以“URL + contents + time stamp”爲 key，以“html 網頁內容”爲值的存儲系統，於是就有了 BigTable 這個鍵值系統的存在。

是啥？

Bigtable is a distributed storage system for managing structured data that is designed to scale to a very large size: petabytes of data across thousands of commodity servers.

官方定義。Bigtable 是一個分佈式的結構化數據存儲系統，它被設計用來處理海量數據：通常是分佈在數千臺普通服務器上的 PB 級的數據。

說清楚 BigTable 存儲啥樣子？一段話（一簞食）

A Bigtable is a sparse, distributed, persistentmulti-dimensionalsorted map.
The map is indexed by a row key, column key, and a timestamp;
each value in the map is an uninterpreted array of bytes.

BigTable 是一個稀疏的、分佈式的、持久化存儲的多維度排序的 Map.（寫過兩天代碼的都不陌生，Map 由 key 和 value 組成）;
Map 的 key 是行關鍵字、列關鍵字以及時間戳組成；
Map 的 value 都是一個未經解析的 byte 數組。

看透徹 BigTable 存儲啥樣子？一張圖（一瓢飲）

可以看出 BigTable 用三維（row 行關鍵字、column 列關鍵字、time 時間戳）方式定位數據，也就是以“行關鍵字、列關鍵字、時間戳”爲 key 來定位數據；
我們也可以認爲 BigTable 是屬於 key-Value 的 NOSQL 數據庫系列（爲你在技術選型時再加一備選）。

一段話（一簞食）+ 一張圖（一瓢飲） = BigTable（足矣）。

好了，到這應該對 BigTable 懵懵懂，如果感覺蒙圈、迷茫了，建議動動手指分享轉發一下（言外之意：如果沒看懂，就忽略此篇分享，莫要影響心情，因爲愉悅的心情真的很重要！！！）；如果感覺稍微有點意思或者豁然開朗，那就繼續往下追。

設計？

默默跟隨“一猿小講”腳步的應該都清楚，GFS 也好、MapReduce 也罷，參與者角色都採取了簡單就是美的大道至簡的思想設計，都秉承了“一人掌權，其他人辦事”的理念，那我們不妨看看 BigTable 背後是不是也是這樣的設計呢？

BigTable 主要參與者：鏈接到客戶程序中的庫、一個 Master 服務器和多個 Tablet 服務器（這不就是咱們之前說 GFS 的皇上~宰相模式）。

Master服務器（皇上）主要負責以下工作：

爲 Tablet 服務器分配 Tablets；
檢測新加入的或者過期失效的 Tablet 服務器；
對 Tablet 服務器進行負載均衡；
對保存在 GFS 上的文件進行垃圾收集；
對模式的相關修改操作，例如建立表和列族。

Tablet服務器（宰相）主要負責以下工作：

管理一個 Tablet 的集合（通常每個服務器有大約數十個至上千個 Tablet）；
負責處理它所加載的 Tablet 的讀寫操作；
負責在 Tablets 過大時，對其進行分割。

運轉？

寫操作。

Tablet 服務器首先檢查這個操作格式是否正確、操作發起者是否有執行這個操作的權限；
如果校驗通過，將寫請求提交到日誌 tablet log；
然後將數據寫入內存中的 memtable；
當 memtable 存到一定規模會被凍結，Bigtable 隨之創建一個新的 memtable，並將凍結的 memtable 寫入分佈式文件系統 GFS。

讀操作。

Tablet 服務器首先進行完整性和權限檢查；
然後將一系列 SSTable 和 memtable 的存儲內容組成一個
大的視圖，然後從中進行讀取。

設計要點：讀也好，寫也罷，客戶程序其實直接和 Tablet 服務器通信進行讀寫操作，所以 Master 服務器的負載是很輕的。

技術棧？

BigTable 使用 Google 的分佈式文件系統 GFS作爲底層數據存儲。

BigTable 內部存儲數據的文件是 Google SSTable 格式的；（SSTable 是一個持久化的、排序的、不可更改的 Map 結構，點一首楊坤的“無所謂”送給你，該糾結時糾結，不該糾結時莫糾結，重要的是心情愉悅）。

BigTable 使用 Chubby 提供協同服務管理（若懵圈了，就想想 ZooKeeper）。

思考？

畫龍畫虎難畫骨！目前的一切還是浮於表象，有沒有更進一步的認識呢？那就讓時間來告訴我們吧！

好了，這篇分享都到這兒吧，希望你們能夠喜歡，如果感覺有點幫助，那就動動手指轉發分享一下吧。

推薦閱讀：

從谷歌 GFS 架構設計聊開去

悟懂MapReduce，不糾結！

這部技術葵花寶典真的很硬核

苦澀的技術我該怎麼學？Akka 實戰

站內首發文章

cpongo8888 企業博客

發佈了1446 篇原創文章 · 獲贊 118 · 訪問量 17萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

解密Prompt系列31. LLM Agent之從經驗中不斷學習的智能體

Agent智能體的工作流可以簡單分成兩種：一種是固定的靜態工作流，一種是智能體自主決策的動態工作流。靜態流程的Agent舉幾個例子，例如新聞熱點追蹤推送Agent，每日新論文摘要總結Agent，它們的優點是可控，穩定，可復現，缺點是一種流

風雨中的小七

2024-06-11 14:22:16

第十二節：MySQL8.x版本新特性和變化

一. 二. 三. ! 作者 : Yaopengfei(姚鵬飛) 博客地址 : http://www.cnblogs.com

2024-06-11 14:21:36

杭州的 IT 崩盤了麼？

大家好，我是R哥。今天分享一個爽飛了的面試輔導 case：這個杭州兄弟空窗期 1 個月+，面試了 6 家公司 0 Offer，不知道問題出在哪，難道是杭州的 IT 崩盤了麼？報名面試輔導後，經過一個多月的輔導打磨，現在成功入職某上市

2024-06-11 14:21:26

Azure Virtual Network (22) 多訂閱使用Azure DNS解析問題 Windows Azure Platform 系列文章目錄

　　《Windows Azure Platform 系列文章目錄》　　部署環境：　　1.我們只有1個訂閱，1個Virtual Network 　　2.我們有1個Hub-VNet, 在Virtual Network上設置了DNS Se

Lei Zhang的博客

2024-06-11 14:20:36

VS2022 解決方案打不開 .NET Framework 4.0 、 4.5 等老項目

vs2022開發工具最低支持net4.8，以下的如net3.5、4.0、4.5項目，加載不上怎麼處理。一、下載.NET Framework框架 .NET Framework 4.5.2 .NET Framework 4.5.1 .NET

鄭州-在路上

2024-06-11 14:20:26

Python 潮流週刊#55：分享 9 個高質量的技術類信息源！

大家好，我是貓哥，今天給大家分享幾個高質量的技術類信息源。本文分享的信息源都是週刊類型的，所謂週刊類，就是以固定每週的頻率更新，每期分享很多精華內容的鏈接。它的特點是信息密度極高，可以節省你去查找信息的時間，高效的學習者都會喜歡這類內容。

豌豆花下貓

2024-06-11 14:19:16

統計vertica表的行數

select anchor_table_schema || '.' || anchor_table_name as table_name, row_countfrom PROJECTION_STORAGEorder by row_co

卡卡西村長

2024-06-11 14:19:16

開源高性能結構化日誌模塊NanoLog

最近在寫數據庫程序，需要一個高性能的結構化日誌記錄組件，簡單研究了一下Microsoft.Extensions.Logging和Serilog，還是決定重造一個輪子。一、使用方法直接參考以下示例代碼: NanoLogger.St

2024-06-11 14:18:16

Vue3 運行可以，build 打包發佈報錯，app.config.globalProperties 用法坑

目錄錯誤原因解決方案 app.config.globalProperties 用法坑Vue，多環境配置 https://www.cnblogs.com/vipsoft/p/16696640.html main.js import conf

2024-06-11 14:15:15

Vue 打包 Error: error:0308010C:digital envelope routines::unsupported

這個錯誤通常與Node.js的加密模塊和OpenSSL版本有關出現這個錯誤是因爲 node.js V17版本中最近發佈的OpenSSL3.0, 而OpenSSL3.0對允許算法和密鑰大小增加了嚴格的限制，可能會對生態系統造成一些影響. j

2024-06-11 14:15:05

Windows 允許空密碼遠程桌面

Windows 允許空密碼遠程桌面開啓遠程修改策略輸入命令 secpol.msc 本地策略 -> 安全選項 -> 帳戶：使用空密碼的本地帳戶只允許進行控制檯登錄

2024-06-11 14:15:05

dubbo~全局異常攔截器的使用與設計缺陷~續

上一次的介紹，主要圍繞如何統一去捕獲異常，以及爲每一種異常添加自己的Mapper實現，並且我們知道，當在ExceptionMapper中返回非200的Response，不支持application/json的響應類型，而是寫死的text/p

2024-06-11 14:12:35

如何安全地訪問互聯網

當你深夜在瀏覽器中輸入 www.baidu.com 時有沒有想過，除了月黑風高的夜和本機的瀏覽記錄，還有誰知道你訪問了它呢？要搞清楚這件事，首先我們要了解一下訪問網站時，這其中發生了什麼。如果你在 10 年之前訪問網站，大概率會在瀏覽器的

2024-06-11 14:08:15

前端使用 Konva 實現可視化設計器（14）- 折線 - 最優路徑應用【代碼篇】

話接上回《前端使用 Konva 實現可視化設計器（13）- 折線 - 最優路徑應用【思路篇】》，這一章繼續說說相關的代碼如何構思的，如何一步步構建數據模型可供 AStar 算法進行路徑規劃，最終畫出節點之間的連接折線。請大家動動小手，給

2024-06-11 14:08:05

[快速閱讀七] Halcon裏emphasize函數相關資料.

　　時不時有人問我我的SSE優化Demo裏emphasize（邊緣強調）的原理是啥，有沒有寫博客，其實不是我不願意寫博客，而是那個東西太過於簡單，我不想寫博客。但是耐不住問的人多了，我就乾脆複製點資料放在博客裏吧，省的每次我還要去找點資料複

2024-06-11 14:08:05

24小時熱門文章

最新文章

最新評論文章