學習Redis Cluster並手動搭建集羣

Redis Cluster採用虛擬槽分區,所有的鍵根據哈希函數映射到0~16383整數槽內,計算公式:slot=CRC16(key)&16383。槽是集羣內數據管理和遷移的基本單位。採用大範圍槽的主要目的是爲了方便數據拆分和集羣擴展。每個節點會負責一定數據的槽,如下圖所示:

image.png

當集羣有5個節點,每個節點平均大約負載3276個槽。由於採用高質量的哈希算法,每個槽所映射的數據通常比較均勻,將數據平均劃分到5個節點進行數據分區。每一個節點負責維護一部分槽以及槽所映射的鍵值數據,如下圖所示:

image.png

Redis虛擬槽分區的特點:

解耦數據和節點之間的關係,簡化了節點擴容和收縮難度。

節點自身維護槽的映射關係,不需要客戶端或者代理服務維護槽分區元數據。

支持節點、槽、鍵之間的映射查詢,用於數據路由、在線伸縮等場景。

數據分區是分佈式存儲的核心,理解和靈活運用數據分區規則對於掌握Redis Cluster非常有幫助。

集羣功能限制

Redis集羣相對單機的功能上存在一些限制,需要開發人頁提前瞭解,在使用時做好規避。限制如下:

1)key批量操作支持有限。如mset、mget,目前只支持具有相同slot值的key執行批量操作。對於映射爲不同slot值的key由於執行mget、mset等操作可能存在於多個節點上因此不被支持。

2)key事務操作支持有限。同理只支持多key在同一節點上的事務操作,當多個key分佈在不同的節點上時無法使用事務功能。

3)key作爲數據分區的最小粒度,因此不能將一個大的鍵值對象如hash、list等映射到不同的節點。

4)不支持多數據庫空間。單機下的Redis可以支持16個數據庫,集羣模式下只能使用一個數據庫空間,即db0。

5)複製結構只支持一層,從節點只能複製主節點,不支持嵌套樹狀複製結構。

搭建集羣

下面開始搭建集羣工作,需要以下三個步驟:

1)準備節點

2)節點握手

3)分配槽

準備節點

節點規劃,使用三臺機器,第臺機器上部署兩個Redis實例,分別爲一主一從。

redis_1 192.168.56.120
redis_2 192.168.56.121
redis_3 192.168.56.122

Redis集羣一般由多個節點組成,節點數據至少爲6個才能保證組成完整高可用的集羣。每個節點需要開啓配置cluster-enabled yes,讓Redis運行在集羣模式下。建議爲集羣內所有節點統一目錄,一般劃分三個目錄:conf、data、log,分別存放配置、數據和日誌相關文件。把6個節點配置統一放在conf目錄下,集羣相關配置如下:

#節點端口
port 6379
#開啓集羣模式
cluster-enabled yes
#節點超時時間,單位毫秒
cluster-node-timeout 15000
#集羣內部配置文件
cluster-config-file "nodes-6379.conf"

其他配置和單機模式一致即可,配置文件命名規則redis-{port}.conf,準備好配置後啓動所有節點,命令如下:

#redis_1
redis-server conf/redis-6379.conf &
redis-server conf/redis-6380.conf &
#redis_2
redis-server conf/redis-6379.conf &
redis-server conf/redis-6380.conf &
#redis_3
redis-server conf/redis-6379.conf &
redis-server conf/redis-6380.conf &

檢查節點是日誌是否正確,內容如下

5200:M 05 Apr 11:28:18.931 * No cluster configuration found, I'm 383261e3f0053f74c953bd07ceee36a4b5795bc3
......                                             
Redis 4.0.13 (00000000/0) 64 bit
Running in cluster mode
Port: 6380
PID: 5200
.......
5200:M 05 Apr 11:28:18.943 * Ready to accept connections

redis_1上的6379節點啓動成功,第一次啓動時如果沒有集羣配置文件,它會自動創建一份,文件名稱採用cluster-config-file參數項控制,建議採用node-{port}.conf格式定義,通過使用端口號區分不同節點,防止同一機器下多個節點彼此覆蓋,造成集羣信息異常。如果啓動時存在集羣配置文件,節點會使用配置文件內容初始化集羣信息,啓動過程如下圖:

image.png

集羣模式的Redis除了原有的配置文件之外又加了一份集羣配置文件。當集羣節點信息發生變化,如添加節點、節點下線、故障轉移等。節點會自動保存集羣狀態到配置文件中。需要注意的是,Redis自動維護集羣配置文件,不要手動修改,防止節點重啓時產生集羣信息錯亂。

如redis_3的6379實例首次啓動後生成集羣配置如下:

[redis@redis_3 ~]$ cat data/nodes-6379.conf 

275753d11365feabb366170b940bca4b8486bbd7 :0@0 myself,master - 0 0 0 connected

vars currentEpoch 0 lastVoteEpoch 0

文件內容記錄了集羣初始狀態,這裏最重要的是節點ID,它是一個40位16進制字符串,用於標準集羣內一個節點,之後很多集羣操作都要藉助於節點ID來完成。需要注意的是,節點IDeas不同於運行IDeas。節點IDeas在集羣初始化時只創建一次,節點重啓時會加載集羣配置文件進行重用,而Redis的運行IDeas每次重啓都 會變化。在redis_3的6379節點上執行cluster nodes命令獲取集羣節點狀態:

127.0.0.1:6380> cluster nodes

d54639285709a65bb8ca331f26d4fe1b1c8c73ca :6380@16380 myself,master - 0 0 0 connected

每個節點目前只能識別出自己的節點信息。我們啓動6個節點,但每個節點彼此不知道對方的存在,下面通過節點握手讓6個節點彼此建議聯繫從而組成一個集羣。

節點握手

節點握手是批一批運行在集羣模式下的節點通過Gossip協議彼此通信,達到感知對方的過程。節點握手是集羣彼此通信的第一步,由客戶端發起命令:cluster meet {ip} {port},如下圖所示

image.png

圖中執行的命令是:cluster meet 127.0.0.1 6380讓節點6379和6380進行握手通信。cluster meet命令是一個異步命令,執行之後立刻返回。內部發起與目標節點進行握手通信,如圖所示

image.png

1)節點6379本地創建6380節點信息對象,併發送meet消息。

2)節點6380接受到meet消息後,保存6379節點信息並回復pong消息。

3)之後節點6379和6380彼此定期通過ping/pong消息進行正常的節點通信。

這裏的meet、ping、pong消息是Gossip協議通信的載體,之後的節點通信部分做進一步介紹,它的主要作用是節點彼此交換狀態數據信息。6379和6380節點通過meet命令彼此建議通信之後集羣結構如圖:

image.png

執行完cluster meet後,可以通過cluster nodes看到兩個實例都檢查到了對方的存在

[redis@redis_1 ~]$ redis-cli -h redis_1 -p 6379
redis_1:6379> cluster meet 192.168.56.120 6380
OK
redis_1:6379> cluster nodes
383261e3f0053f74c953bd07ceee36a4b5795bc3 192.168.56.120:6380@16380 master - 0 1554440139158 1 connected
ceaf2ccb751978b7334ddeca474da3d6b7aac99b 192.168.56.120:6379@16379 myself,master - 0 0 0 connected
redis_1:6379> exit
[redis@redis_1 ~]$ redis-cli -h redis_1 -p 6380
redis_1:6380> cluster nodes
ceaf2ccb751978b7334ddeca474da3d6b7aac99b 192.168.56.120:6379@16379 master - 0 1554440152934 0 connected
383261e3f0053f74c953bd07ceee36a4b5795bc3 192.168.56.120:6380@16380 myself,master - 0 0 1 connected
redis_1:6380>

使用如下命令把其他節點加入集羣,只需要在集羣內任意節點執行cluster meet命令加入新節點,握手狀態會通過消息在集羣內傳播,這樣其他節點會自動發現新節點併發起握手流程。最後執行cluster nodes命令確認6個節點都彼此感知並組成了集羣:

[redis@redis_1 ~]$ redis-cli -h redis_1 -p 6379
redis_1:6379> cluster meet 192.168.56.121 6379
OK
redis_1:6379> cluster meet 192.168.56.121 6380
OK
redis_1:6379> cluster meet 192.168.56.122 6379
OK
redis_1:6379> cluster meet 192.168.56.122 6380
OK
redis_1:6379> cluster nodes
275753d11365feabb366170b940bca4b8486bbd7 192.168.56.122:6379@16379 master - 0 1554440316783 4 connected
383261e3f0053f74c953bd07ceee36a4b5795bc3 192.168.56.120:6380@16380 master - 0 1554440316000 1 connected
ceaf2ccb751978b7334ddeca474da3d6b7aac99b 192.168.56.120:6379@16379 myself,master - 0 1554440315000 5 connected
d54639285709a65bb8ca331f26d4fe1b1c8c73ca 192.168.56.122:6380@16380 master - 0 1554440316000 0 connected
ca4f05809dc9a9eda4292a33b994b4e2aab13033 192.168.56.121:6380@16380 master - 0 1554440317000 3 connected
a85bbb17a3f559d18d7f5059f14ffd9f6ba48ee1 192.168.56.121:6379@16379 master - 0 1554440315000 2 connected

握手完成後集羣的狀態如下圖:

image.png

節點建議握手之後集羣還不能正常工作,這裏集羣處理下線狀態,所有的數據讀寫都被禁止。通過如下命令可以看到:

redis_2:6379> set hello world
(error) CLUSTERDOWN Hash slot not served

通過cluster info 命令可以獲取集羣當前狀態:

redis_2:6379> cluster info
cluster_state:fail
cluster_slots_assigned:0
cluster_slots_ok:0
cluster_slots_pfail:0
cluster_slots_fail:0
cluster_known_nodes:6
cluster_size:0
cluster_current_epoch:5
cluster_my_epoch:2
cluster_stats_messages_ping_sent:315
cluster_stats_messages_pong_sent:314
cluster_stats_messages_meet_sent:3
cluster_stats_messages_sent:632
cluster_stats_messages_ping_received:312
cluster_stats_messages_pong_received:318
cluster_stats_messages_meet_received:2
cluster_stats_messages_received:632

從輸出內容可以看到,被分配的槽(cluster_slots_assigned)是0,由於目前所有的槽沒有分配節點,因此集羣無法完成槽到節點的映射。只有當16384個槽全部分配給節點後,集羣才進入在線狀態。

分配槽

Redis集羣把所有的數據映射到16384個槽中。每個key會映射爲一個固定的槽,只有當節點分配了槽,才響應和這些槽相關聯的鍵命令。通過cluster addslots命令爲節點分配槽。這些利用bash特性批量設置槽(slots),命令如下:

[redis@redis_1 ~]$ redis-cli -h redis_1 -p 6379 cluster addslots {0..5461}
OK
[redis@redis_1 ~]$ redis-cli -h redis_2 -p 6379 cluster addslots {5462..10922}
OK
[redis@redis_1 ~]$ redis-cli -h redis_3 -p 6379 cluster addslots {10923..16383}
OK

把16384個slot平均分配給redis_1/2/3的6379三個節點。執行cluster info查看集羣狀態如下所示:

[redis@redis_1 ~]$ redis-cli -h redis_2 -p 6379 cluster info
cluster_state:ok
cluster_slots_assigned:16384
cluster_slots_ok:16384
cluster_slots_pfail:0
cluster_slots_fail:0
cluster_known_nodes:6
cluster_size:3
cluster_current_epoch:5
cluster_my_epoch:2
cluster_stats_messages_ping_sent:1062
cluster_stats_messages_pong_sent:1067
cluster_stats_messages_meet_sent:3
cluster_stats_messages_sent:2132
cluster_stats_messages_ping_received:1065
cluster_stats_messages_pong_received:1065
cluster_stats_messages_meet_received:2
cluster_stats_messages_received:2132

當前集羣狀態是OK,集羣進入在線狀態。所有的槽都已經分配給節點,執行cluster nodes命令可以看到節點和槽的分配關係:

[redis@redis_1 ~]$ redis-cli -h redis_2 -p 6379 cluster nodes
a85bbb17a3f559d18d7f5059f14ffd9f6ba48ee1 192.168.56.121:6379@16379 myself,master - 0 1554441448000 2 connected 5462-10922
ceaf2ccb751978b7334ddeca474da3d6b7aac99b 192.168.56.120:6379@16379 master - 0 1554441448455 5 connected 0-5461
ca4f05809dc9a9eda4292a33b994b4e2aab13033 192.168.56.121:6380@16380 master - 0 1554441449000 3 connected
383261e3f0053f74c953bd07ceee36a4b5795bc3 192.168.56.120:6380@16380 master - 0 1554441450000 1 connected
d54639285709a65bb8ca331f26d4fe1b1c8c73ca 192.168.56.122:6380@16380 master - 0 1554441450491 0 connected
275753d11365feabb366170b940bca4b8486bbd7 192.168.56.122:6379@16379 master - 0 1554441449470 4 connected 10923-16383

目前還有三個節點沒有使用,作爲一個完整的集羣,每個負責處理槽的節點應該具有從節點,保證當它出現故障時可以自動進行故障轉移。集羣模式下,Redis節點角色分爲主節點和從節點。首次啓動的節點和被分配槽的節點都是主節點,從節點負責複製主節點槽信息和相關的數據。使用cluster replicate {nodeID}命令讓一個節點成爲從節點。其中命令執行必須在對應的從節點上執行,nodeID是要複製主節點的節點ID,命令如下:

[redis@redis_1 ~]$ redis-cli -h redis_1 -p 6380 cluster replicate a85bbb17a3f559d18d7f5059f14ffd9f6ba48ee1
OK
[redis@redis_1 ~]$ redis-cli -h redis_2 -p 6380 cluster replicate 275753d11365feabb366170b940bca4b8486bbd7
OK
[redis@redis_1 ~]$ redis-cli -h redis_3 -p 6380 cluster replicate ceaf2ccb751978b7334ddeca474da3d6b7aac99b
OK

複製(replication)完成後,整個集羣的結構如圖

image.png

到此爲止,我們依照Redis協議手動建立一個集羣。它由6個節點構成,3個主節點負責處理槽和相關數據,3個從節點負責故障轉移。


博文內容主要參考《Redis開發與運維》一書。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章