TIDB 學習計劃 --- 什麼是分佈式數據庫和TIDB 整體架構

原創

Austindatabases

2020-07-02 17:35

從今天開始就準備學習TIDB數據庫，初期基礎差,學習可能會比較困難入門後可能就會好很多

TIDB 是一個分佈式，強一致的可水平擴展的關係型數據庫，在TIDB 設計之初，聚焦了四個設計的要點

1 水平擴展，在設計之初水平擴展是最基本的需求，通過添加機器的方式擴展，存儲的能力和計算的能力

2 高可用， TIDB 作爲分佈式數據庫，節點衆多，對於節點失效和數據庫滾動升級，需要解決少量節點失效的問題

3 ACID 事務，雖然部分數據庫爲了更高效的存儲和處理數據，拋棄了SQL和事務，但在生產中的交易場景中，事務是非常重要的，另一個主要的原因在於如果事務的問題不在本地存儲，而是業務解決或者中間件解決，這樣做比較難做到高效

4 SQL 支持，提供MYSQL 的支持，讓整體使用數據庫變得簡單

下面是一張TIDB 的結構圖

TIDB 存儲引擎是TIKV 數據庫存儲引擎，採用了分層的架構來實現

1 transaction

2 MVCC

3 raft

4 local kv storage

容災與特點

高度分層，底層爲ROCKSDB，通過raft來進行數據存儲的高可用，高度分層的主要原因是可以更獨立的進行層次的切換。通過多副本的方式進行數據的存儲，通過raft 進行強一致，多個副本中只有一個leader 其他節點爲follower，其中leader 和follower值不固定的，在leader失效後，會選擇follower通過算法變爲leader的角色變換。

Raft 本身是支持一份數據的強一致的多副本，分佈式數據如何切片，如何將不同的切片放到不同的位置上，這就需要一個分片的算法，基於hash的分片，或者基於range 劃分，但由於數據庫在查詢中會涉及到一段連續值的查詢的可能，則利用range分片比較合理。將存儲KEY 的空間進行切分，主要根據KEY VALUE存儲的閾值來進行，默認96MB進行數據的切分。

下圖是一個多節點中某個節點 region 從節點 1 到節點4的過程