數據庫中間件系列架構實戰-功能解析

原創

2020-06-29 09:31

讀寫分離

分片原則
1. 與拆分表有關係的表一起分表，例如事務，業務關聯
2. 依據業務來分片，如果沒有，才用主鍵分片
3. 選擇的業務字段，應該是最頻繁的或者最重要的查詢條件
4. 選擇的業務字段，應該能儘可能均勻的分佈到所有的節點
水平拆分

如果我按照oid拆分，但是我現在查詢語句只有uid，那麼就會全表掃描

如果我按照uid拆分，但是我現在查詢語句只有oid，那麼也會全表掃描

那麼我可以進行二維拆分，同時按照oid和uid進行拆分

此時如果我的查詢條件既有oid又有uid，那麼我很容易找到我需要的數據

如果查詢條件只有oid，那麼就會掃描帶有oid的那一個系列

同理，如果查詢條件只有uid，那麼就會掃描帶有uid的那一個系列

固定哈希算法足夠簡單實用，根據數據特點能夠均勻分佈，但是在數據庫擴容的時候，固定哈希算法遷移非常複雜，由於取模的結果變化，絕大部分數據都要進行遷移，當數據庫倍增的時候，數據遷移最少，但也高達 50%，而且倍增的成本比較高。
一致性hash的原理就是通過該算法計算出 key 的 hashcode 之後進行 2^32 取模，那麼數據就會落在 0~2^32 所組成的環中；然後對現在提供的節點進行範圍分配，假設我有8個節點，將0～2^32的範圍均分到每個節點，然後根據取模之後的值計算落到哪個節點。好處是現在我發現第5號節點壓力過大，我想加一個節點，那麼我只需要將5號節點的範圍縮小一半，然後使用新加入的節點負責另一半，此時只需要遷移5號節點的另一半數據，如果數據分佈均勻，遷移的數據就只有16分之一
虛擬節點，有時候會出現熱點問題，一致性哈希並不能解決。所以可以引入虛擬節點的概念，它是物理節點的映射，一個物理節點可以複製出多個虛擬節點，儘可能的讓它均勻分佈在環上，那麼即使數據再集中，其實也會存儲在不同的節點上，可以起到負載均衡的作用。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.