程序員必看的算法一致性Hash算法實現原理

原創

2020-02-21 17:19

Hash環

我們把2_{32次方想成一個環，比如鐘錶上有60個分針點組成一個圓，那麼hash環就是由2}32個點組成的圓。第一個點是0，最後一個點是2_{32-1,我們把這2}32個點組成的環稱之爲HASH環。

![圖片](https://uploader.shimo.im/f/FcmwzbmsdosBR1Q4.png!thumbnail)

一致性Hash算法

將memcached物理機節點通過Hash算法虛擬到一個虛擬閉環上（由0到2_{32構成），key請求的時候通過Hash算法計算出Hash值然後對2}32取模，定位到環上順時針方向最接近的虛擬物理節點就是要找到的緩存服務器。

假設有ABC三臺緩存服務器：

我們使用這三臺服務器各自的IP進行hash計算然後對2~32取模即：

***Hash(服務器IP)%2~32***

計算出來的結果是0到2~32-1的一個整數，那麼Hash環上必有一個點與之對應。比如：

現在緩存服務器已經落到了Hash環上，接下來我們就看我們的數據是怎麼放到緩存服務器的？

我們可以同樣對Object取Hash值然後對2~32取模，比如落到了接近A的一個點上：

那麼這個數據理應存到A這個緩存服務器節點上

所以，在緩存服務器節點數量不變的情況下，緩存的落點是不會變的。

但是如果B掛掉了呢？

按照hash且取模的算法，圖中3這個Object理應就分配到了C這個節點上去了，所以就會到C上找緩存數據，結果當然是找不到，進而從DB讀取數據重新放到了C上。

但是對於編號爲1,2的Object還是落到A，編號爲4的Object還是落到C，B宕機所影響的僅僅是3這個Object。這就是一致性Hash算法的優點。

Hash環的傾斜

前面我們理想化的把三臺memcache機器均勻分到了Hash環上：

但是現實情況可能是：

如果Hash環傾斜，即緩存服務器過於集中將會導致大量緩存數據被分配到了同一個服務器上。比如編號1,2,3,4,6的Object都被存到了A，5被存到B，而C上竟然一個數據都沒有，這將造成內存空間的浪費。

爲了解決這個問題，一致性Hash算法中使用“虛擬節點”解決。

虛擬節點解決Hash環傾斜

“虛擬節點”是“實際節點”在hash環上的複製品，一個實際節點可能對應多個虛擬節點。這樣就可以將ABC三臺服務器相對均勻分配到Hash環上，以減少Hash環傾斜的影響，使得緩存被均勻分配到hash環上。

Hash算法平衡性

平衡性指的是hash的結果儘可能分佈到所有的緩存中去，這樣可以使得所有的緩存空間都可以得到利用。但是hash算法不保證絕對的平衡性，爲了解決這個問題一致性hash引入了“虛擬節點”的概念。虛擬節點”（ virtual node ）是實際節點在 hash 空間的複製品（ replica ），一實際個節點對應了若干個“虛擬節點”，這個對應個數也成爲“複製個數”，“虛擬節點”在 hash 空間中以 hash 值排列。“虛擬節點”的hash計算可以採用對應節點的IP地址加數字後綴的方式。

例如假設 cache A 的 IP 地址爲202.168.14.241 。

引入“虛擬節點”前，計算 cache A 的 hash 值：

Hash(“202.168.14.241”);

引入“虛擬節點”後，計算“虛擬節”點 cache A1 和 cache A2 的 hash 值：

Hash(“202.168.14.241#1”);  // cache A1

Hash(“202.168.14.241#2”);  // cache A2

這樣只要是命中cacheA1和cacheA2節點，就相當於命中了cacheA的緩存。這樣平衡性就得到了提高。

參考：https://www.cnblogs.com/yixiwenwen/p/3580646.html

站內首發文章

SpringBoot_

發佈了32 篇原創文章 · 獲贊 276 · 訪問量 3萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

程序員必看的算法一致性Hash算法實現原理

Hash環

一致性Hash算法

Hash環的傾斜

虛擬節點解決Hash環傾斜

Hash算法平衡性

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

深入理解JVM虛擬機（文末有視頻講解）

Spring事務原理源碼剖析

【架構系列】100億數據1萬屬性數據架構設計

超詳細Spring Boot面試問題集錦，面試 Spring Boot 再也不怕了，答案都在這裏了！

【金三銀四-JVM系列】CMS收集器與GC日誌分析定位問題詳解

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結