數據庫SQL(十一)：Bigtable

原創

2020-07-08 10:36

文章目錄

一、誕生背景

BigTable設計的動機與目標

一、誕生背景

BigTable設計的動機與目標

動機
需要存儲的數據種類繁多、類型多樣，例如URL.圖片、文字、視頻、html文件、用戶設置數據等；
需要處理海量的服務請求；
商用數據庫無法滿足Google的需求，底層系統技術的掌控便於系統維護和升級；
目標
廣泛的適用性:滿足Google的系列產品的需求；
很強的可擴展性:橫向擴展和縱向擴展；
高可用性:確保系統24X7可用；
簡單:底層系統簡單減少出錯概率，爲上層應用開發提供便利；

二、 BigTable的數據模型

分佈式多維映射表結構
表中數據通過行關鍵字(Rowkey) 、列關鍵字(Columnkey)以及時間戳進行索引，所有數據以字符串形式存儲，由用戶解析數據
存儲邏輯表示爲(row:string,column:string. item:int64) -> string

例:網頁www.cnn.com的數據片段
行名稱是倒排的URL；
便於同一地址城的網頁被存儲在表中連續的位置；
便於數據壓縮，大幅提高壓縮率；
contents列族包含了網頁內容；
anchor列族包含了任何引用這個頁面的anchor文本；
CNN的主頁被Sports Illustrated和MY-look主頁同時引用，因此，行包含了名稱爲”anchor:cnnsi.com"和”anchor:my.look.ca" 的列。
每個anchor單元格都只一個版本，contents列有三個版本，分別對應於時間戳t3,t5和t6。

三、BigTable的數據模型-Rows

BigTable的row key是任意的字符串，大小不超過64KB
對於每行數據的讀寫操作都是原子的(atomic) ，不管這個行中所包含的列族數量是多少。
BigTable中的數據按照rowkey的字典順序排序。
.單個大規模的大表不利於數據的處理與分析，BigTable將一個表劃分成多個子表(Tablet) ，是負載均衡和數據分發的基本單位。

四、BigTable的數據模型-Column Families

BigTable將column key組織成列族(column family)，是基本的訪問控制單元，每個列族的數據屬於同一個類型，同列族數據壓縮存
在把數據存放到這個列家族的某個column key下之前，必須首先創建這個列族，創建後，可以使用column key
表當中所包含的列族的數量儘可能少(至多幾百個列族)，在操作過程當中，列族很少發生變化;一個表可以包含無限數量的列。
column key命名語法: family:qualifier
例: anchor:cnnsi.com
訪問控制以及磁盤、內存審計在column family級別完成

五、BigTable的數據模型-timestamps

在BigTable中，每個單元都包含相同數據的多個版本，這些版本採用時間戳進行索引。
時間戳是64位整數，代表真實時間，以微秒來計算。客戶應用也可以直接分配時間戳。
需要避免衝突的應用必鬚生成唯一的時間戳。
一個單元的不同版本根據時間戳降序順序存儲，最新的版本可以被最先讀取。
爲了減輕版本數據的管理負擔，BigTable支持用戶設定保存單元中數據的最近n個版本，或者只保存足夠新版本(比如只保存最近7天內的數據版本)

六、Bigtable體系結構

BigTable基於Google的的三個雲計算組件
1）GFS: Google File System
➢基於廉價的商用計算機的大型分佈式文件系統
2）Chubby
➢基於松耦合分佈式系統的鎖服務
➢存儲元數據的存儲系統
➢名字服務
3）WorkQueue
➢分佈式任務調度器，用於處理分佈式系統隊列分組與調度
➢未公開

Chuby會在下一張詳細介紹。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

一場數據架構變革正在來臨

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2021-12-21 10:54:01

解讀數字化轉型下的數據安全：AI正在開闢新的可能性

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-19 14:03:54

雲原生數據庫企業Cockroach Labs再獲 2.73 億美元融資，估值高達50億美元

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-16 15:18:50

數千個數據庫、遍佈全國的物理機，京東物流全量上雲實錄 | 卓越技術團隊訪談錄

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":1}},{"type":"blockquote","content":[{"type":"pa

2021-12-16 10:38:55

前車之鑑：聊聊我在基礎設施中掉過的坑

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-14 13:33:55

洞察數據庫變革趨勢，亞馬遜雲科技正在憑藉這項技術改變着遊戲規則

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-10 16:53:54

MongoDB發佈第三季度財報，雲數據庫收入增長加速

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-09 15:33:57

MySQL探祕(四):InnoDB的磁盤文件及落盤機制

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

程序员历小冰

2021-12-08 12:33:52

Oracle 大佬離職，怒噴 MySQL “糟糕的數據庫”

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-07 19:58:57

Jellyfish：爲Uber最大的存儲系統提供更節省成本的數據分層

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

Mohammed Khatib

2021-12-06 10:33:48

企業需要什麼樣的數據庫，One Size Fits All？

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-03 18:19:01

這個重要開源項目全靠一位低調的“怪老頭”維護！他和比爾蓋茨一樣撐起了計算機世界

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-03 14:23:56

數據庫事務的三個元問題

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2021-12-03 10:33:52

一個 Babelfish ，看懂雲數據庫的發展方向

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":1}},{"type":"paragraph","attrs":{"indent":0,"nu

2021-12-01 18:43:50

數據庫內核雜談(二十一): 流處理系統簡介

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-11-24 10:38:57

24小時熱門文章

最新文章

最新評論文章