Redis集羣介紹

目錄

Redis集羣介紹

Redis 集羣的數據分片

Redis 集羣的主從複製模型

Redis 一致性保證

搭建並使用Redis集羣

搭建集羣

Creating a Redis Cluster using the create-cluster script

使用集羣

使用redis-rb-cluster寫一個例子

集羣重新分片

一個更有趣的程序

測試故障轉移

手動故障轉移

添加一個新節點

添加一個從節點

移除一個節點

從節點的遷移


Redis集羣介紹

Redis 集羣是一個提供在多個Redis間節點間共享數據的程序集。

Redis集羣並不支持處理多個keys的命令,因爲這需要在不同的節點間移動數據,從而達不到像Redis那樣的性能,在高負載的情況下可能會導致不可預料的錯誤.

Redis 集羣通過分區來提供一定程度的可用性,在實際環境中當某個節點宕機或者不可達的情況下繼續處理命令. Redis 集羣的優勢:

  • 自動分割數據到不同的節點上。
  • 整個集羣的部分節點失敗或者不可達的情況下能夠繼續處理命令。

Redis 集羣的數據分片

Redis 集羣沒有使用一致性hash, 而是引入了 哈希槽的概念.

Redis 集羣有16384個哈希槽,每個key通過CRC16校驗後對16384取模來決定放置哪個槽.集羣的每個節點負責一部分hash槽,舉個例子,比如當前集羣有3個節點,那麼:

  • 節點 A 包含 0 到 5500號哈希槽.
  • 節點 B 包含5501 到 11000 號哈希槽.
  • 節點 C 包含11001 到 16384號哈希槽.

這種結構很容易添加或者刪除節點. 比如如果我想新添加個節點D, 我需要從節點 A, B, C中得部分槽到D上. 如果我想移除節點A,需要將A中的槽移到B和C節點上,然後將沒有任何槽的A節點從集羣中移除即可. 由於從一個節點將哈希槽移動到另一個節點並不會停止服務,所以無論添加刪除或者改變某個節點的哈希槽的數量都不會造成集羣不可用的狀態.

Redis 集羣的主從複製模型

爲了使在部分節點失敗或者大部分節點無法通信的情況下集羣仍然可用,所以集羣使用了主從複製模型,每個節點都會有N-1個複製品.

在我們例子中具有A,B,C三個節點的集羣,在沒有複製模型的情況下,如果節點B失敗了,那麼整個集羣就會以爲缺少5501-11000這個範圍的槽而不可用.

然而如果在集羣創建的時候(或者過一段時間)我們爲每個節點添加一個從節點A1,B1,C1,那麼整個集羣便有三個master節點和三個slave節點組成,這樣在節點B失敗後,集羣便會選舉B1爲新的主節點繼續服務,整個集羣便不會因爲槽找不到而不可用了

不過當B和B1 都失敗後,集羣是不可用的.

Redis 一致性保證

Redis 並不能保證數據的強一致性. 這意味這在實際中集羣在特定的條件下可能會丟失寫操作.

第一個原因是因爲集羣是用了異步複製. 寫操作過程:

  • 客戶端向主節點B寫入一條命令.
  • 主節點B向客戶端回覆命令狀態.
  • 主節點將寫操作複製給他得從節點 B1, B2 和 B3.

主節點對命令的複製工作發生在返回命令回覆之後, 因爲如果每次處理命令請求都需要等待複製操作完成的話, 那麼主節點處理命令請求的速度將極大地降低 —— 我們必須在性能和一致性之間做出權衡。 注意:Redis 集羣可能會在將來提供同步寫的方法。 Redis 集羣另外一種可能會丟失命令的情況是集羣出現了網絡分區, 並且一個客戶端與至少包括一個主節點在內的少數實例被孤立。

舉個例子 假設集羣包含 A 、 B 、 C 、 A1 、 B1 、 C1 六個節點, 其中 A 、B 、C 爲主節點, A1 、B1 、C1 爲A,B,C的從節點, 還有一個客戶端 Z1 假設集羣中發生網絡分區,那麼集羣可能會分爲兩方,大部分的一方包含節點 A 、C 、A1 、B1 和 C1 ,小部分的一方則包含節點 B 和客戶端 Z1 .

Z1仍然能夠向主節點B中寫入, 如果網絡分區發生時間較短,那麼集羣將會繼續正常運作,如果分區的時間足夠讓大部分的一方將B1選舉爲新的master,那麼Z1寫入B中得數據便丟失了.

注意, 在網絡分裂出現期間, 客戶端 Z1 可以向主節點 B 發送寫命令的最大時間是有限制的, 這一時間限制稱爲節點超時時間(node timeout), 是 Redis 集羣的一個重要的配置選項。

搭建並使用Redis集羣

搭建集羣的第一件事情我們需要一些運行在 集羣模式的Redis實例. 這意味這集羣並不是由一些普通的Redis實例組成的,集羣模式需要通過配置啓用,開啓集羣模式後的Redis實例便可以使用集羣特有的命令和特性了.

下面是一個最少選項的集羣的配置文件:

port 7000
cluster-enabled yes
cluster-config-file nodes.conf
cluster-node-timeout 5000
appendonly yes

文件中的 cluster-enabled 選項用於開實例的集羣模式, 而 cluster-conf-file 選項則設定了保存節點配置文件的路徑, 默認值爲 nodes.conf.節點配置文件無須人爲修改, 它由 Redis 集羣在啓動時創建, 並在有需要時自動進行更新。

要讓集羣正常運作至少需要三個主節點,不過在剛開始試用集羣功能時, 強烈建議使用六個節點: 其中三個爲主節點, 而其餘三個則是各個主節點的從節點。

首先, 讓我們進入一個新目錄, 並創建六個以端口號爲名字的子目錄, 稍後我們在將每個目錄中運行一個 Redis 實例: 命令如下:

mkdir cluster-test
cd cluster-test
mkdir 7000 7001 7002 7003 7004 7005

在文件夾 7000 至 7005 中, 各創建一個 redis.conf 文件, 文件的內容可以使用上面的示例配置文件, 但記得將配置中的端口號從 7000 改爲與文件夾名字相同的號碼。

從 Redis Github 頁面 的 unstable 分支中取出最新的 Redis 源碼, 編譯出可執行文件 redis-server , 並將文件複製到 cluster-test 文件夾, 然後使用類似以下命令, 在每個標籤頁中打開一個實例:

cd 7000
../redis-server ./redis.conf

實例打印的日誌顯示, 因爲 nodes.conf 文件不存在, 所以每個節點都爲它自身指定了一個新的 ID :

[82462] 26 Nov 11:56:55.329 * No cluster configuration found, I'm 97a3a64667477371c4479320d683e4c8db5858b1

實例會一直使用同一個 ID , 從而在集羣中保持一個獨一無二(unique)的名字。

搭建集羣

現在我們已經有了六個正在運行中的 Redis 實例, 接下來我們需要使用這些實例來創建集羣, 併爲每個節點編寫配置文件。

通過使用 Redis 集羣命令行工具 redis-trib , 編寫節點配置文件的工作可以非常容易地完成: redis-trib 位於 Redis 源碼的 src 文件夾中, 它是一個 Ruby 程序, 這個程序通過向實例發送特殊命令來完成創建新集羣, 檢查集羣, 或者對集羣進行重新分片(reshared)等工作。

./redis-trib.rb create --replicas 1 127.0.0.1:7000 127.0.0.1:7001 \
127.0.0.1:7002 127.0.0.1:7003 127.0.0.1:7004 127.0.0.1:7005

這個命令在這裏用於創建一個新的集羣, 選項–replicas 1 表示我們希望爲集羣中的每個主節點創建一個從節點。

之後跟着的其他參數則是這個集羣實例的地址列表,3個master3個slave redis-trib 會打印出一份預想中的配置給你看, 如果你覺得沒問題的話, 就可以輸入 yes , redis-trib 就會將這份配置應用到集羣當中,讓各個節點開始互相通訊,最後可以得到如下信息:

[OK] All 16384 slots covered

這表示集羣中的 16384 個槽都有至少一個主節點在處理, 集羣運作正常。

Creating a Redis Cluster using the create-cluster script

If you don’t want to create a Redis Cluster by configuring and executing individual instances manually as explained above, there is a much simpler system (but you’ll not learn the same amount of operational details).

Just check utils/create-cluster directory in the Redis distribution. There is a script called create-cluster inside (same name as the directory it is contained into), it’s a simple bash script. In order to start a 6 nodes cluster with 3 masters and 3 slaves just type the following commands:

  1. create-cluster start
  2. create-cluster create

Reply to yes in step 2 when the redis-trib utility wants you to accept the cluster layout.

You can now interact with the cluster, the first node will start at port 30001 by default. When you are done, stop the cluster with:

  1. create-cluster stop.

Please read the README inside this directory for more information on how to run the script.

使用集羣

Redis 集羣現階段的一個問題是客戶端實現很少。

以下是一些我知道的實現:

  • redis-rb-cluster 是我(@antirez)編寫的 Ruby 實現, 用於作爲其他實現的參考。 該實現是對 redis-rb 的一個簡單包裝, 高效地實現了與集羣進行通訊所需的最少語義(semantic).
  • redis-py-cluster 看上去是 redis-rb-cluster 的一個 Python 版本, 這個項目有一段時間沒有更新了(最後一次提交是在六個月之前), 不過可以將這個項目用作學習集羣的起點。
  • 流行的 Predis 曾經對早期的 Redis 集羣有過一定的支持, 但我不確定它對集羣的支持是否完整, 也不清楚它是否和最新版本的 Redis 集羣兼容 (因爲新版的 Redis 集羣將槽的數量從 4k 改爲 16k 了).
  • 使用最多的時java客戶端, Jedis 最近添加了對集羣的支持, 詳細請查看項目README中Jedis Cluster部分.
  • StackExchange.Redis 提供對 C# 的支持(並且包括大部分 .NET 下面的語言,比如: VB, F#等等)
  • thunk-redis 提供對 Node.js 和 io.js的支持。
  • Redis unstable 分支中的 redis-cli 程序實現了非常基本的集羣支持, 可以使用命令 redis-cli -c 來啓動。

測試 Redis 集羣比較簡單的辦法就是使用 redis-rb-cluster 或者 redis-cli , 接下來我們將使用 redis-cli 爲例來進行演示:

$ redis-cli -c -p 7000
redis 127.0.0.1:7000> set foo bar
-> Redirected to slot [12182] located at 127.0.0.1:7002
OK
redis 127.0.0.1:7002> set hello world
-> Redirected to slot [866] located at 127.0.0.1:7000
OK
redis 127.0.0.1:7000> get foo
-> Redirected to slot [12182] located at 127.0.0.1:7002
"bar"
redis 127.0.0.1:7000> get hello
-> Redirected to slot [866] located at 127.0.0.1:7000
"world"

注意: 如果你是使用腳本創建的集羣節點,那麼默認端口可能是從30001開始。

redis-cli 對集羣的支持是非常基本的, 所以它總是依靠 Redis 集羣節點來將它轉向(redirect)至正確的節點。一個真正的(serious)集羣客戶端應該做得比這更好: 它應該用緩存記錄起哈希槽與節點地址之間的映射(map), 從而直接將命令發送到正確的節點上面。這種映射只會在集羣的配置出現某些修改時變化, 比如說, 在一次故障轉移(failover)之後, 或者系統管理員通過添加節點或移除節點來修改了集羣的佈局(layout)之後, 諸如此類。

使用redis-rb-cluster寫一個例子

在展示如何使用集羣進行故障轉移、重新分片等操作之前, 我們需要創建一個示例應用, 瞭解一些與 Redis 集羣客戶端進行交互的基本方法。

在運行示例應用的過程中, 我們會嘗試讓節點進入失效狀態, 又或者開始一次重新分片, 以此來觀察 Redis 集羣在真實世界運行時的表現, 並且爲了讓這個示例儘可能地有用, 我們會讓這個應用向集羣進行寫操作。

本節將通過兩個示例應用來展示 redis-rb-cluster 的基本用法, 以下是本節的第一個示例應用, 它是一個名爲 example.rb 的文件, 包含在redis-rb-cluster 項目裏面

 1  require './cluster'
 2
 3  startup_nodes = [
 4      {:host => "127.0.0.1", :port => 7000},
 5      {:host => "127.0.0.1", :port => 7001}
 6  ]
 7  rc = RedisCluster.new(startup_nodes,32,:timeout => 0.1)
 8
 9  last = false
10
11  while not last
12      begin
13          last = rc.get("__last__")
14          last = 0 if !last
15      rescue => e
16          puts "error #{e.to_s}"
17          sleep 1
18      end
19  end
20
21  ((last.to_i+1)..1000000000).each{|x|
22      begin
23          rc.set("foo#{x}",x)
24          puts rc.get("foo#{x}")
25          rc.set("__last__",x)
26      rescue => e
27          puts "error #{e.to_s}"
28      end
29      sleep 0.1
30  }

這個應用所做的工作非常簡單: 它不斷地以 foo<number> 爲鍵, number 爲值, 使用 SET 命令向數據庫設置鍵值對:

  • SET foo0 0
  • SET foo1 1
  • SET foo2 2
  • And so forth…

代碼中的每個集羣操作都使用一個 begin 和 rescue 代碼塊(block)包裹着, 因爲我們希望在代碼出錯時, 將錯誤打印到終端上面, 而不希望應用因爲異常(exception)而退出。

代碼的第七行是代碼中第一個有趣的地方, 它創建了一個 Redis 集羣對象, 其中創建對象所使用的參數及其意義如下:第一個參數是記錄了啓動節點的 startup_nodes 列表, 列表中包含了兩個集羣節點的地址。第二個參數指定了對於集羣中的各個不同的節點, Redis 集羣對象可以獲得的最大連接數 ,第三個參數 timeout 指定了一個命令在執行多久之後, 纔會被看作是執行失敗。

啓動列表中並不需要包含所有集羣節點的地址, 但這些地址中至少要有一個是有效的: 一旦 redis-rb-cluster 成功連接上集羣中的某個節點時, 集羣節點列表就會被自動更新, 任何真正的的集羣客戶端都應該這樣做。

現在, 程序創建的 Redis 集羣對象實例被保存到 rc 變量裏面, 我們可以將這個對象當作普通 Redis 對象實例來使用。

在十一至十九行, 我們先嚐試閱讀計數器中的值, 如果計數器不存在的話, 我們纔將計數器初始化爲 0 : 通過將計數值保存到 Redis 的計數器裏面, 我們可以在示例重啓之後, 仍然繼續之前的執行過程, 而不必每次重啓之後都從 foo0 開始重新設置鍵值對。爲了讓程序在集羣下線的情況下, 仍然不斷地嘗試讀取計數器的值, 我們將讀取操作包含在了一個 while 循環裏面, 一般的應用程序並不需要如此小心。

二十一至三十行是程序的主循環, 這個循環負責設置鍵值對, 並在設置出錯時打印錯誤信息。程序在主循環的末尾添加了一個 sleep 調用, 讓寫操作的執行速度變慢, 幫助執行示例的人更容易看清程序的輸出。執行 example.rb 程序將產生以下輸出:

ruby ./example.rb
1
2
3
4
5
6
7
8
9
^C (I stopped the program here)

這個程序並不是十分有趣, 稍後我們就會看到一個更有趣的集羣應用示例, 不過在此之前, 讓我們先使用這個示例來演示集羣的重新分片操作。

集羣重新分片

現在, 讓我們來試試對集羣進行重新分片操作。在執行重新分片的過程中, 請讓你的 example.rb 程序處於運行狀態, 這樣你就會看到, 重新分片並不會對正在運行的集羣程序產生任何影響, 你也可以考慮將 example.rb 中的 sleep 調用刪掉, 從而讓重新分片操作在近乎真實的寫負載下執行 重新分片操作基本上就是將某些節點上的哈希槽移動到另外一些節點上面, 和創建集羣一樣, 重新分片也可以使用 redis-trib 程序來執行 執行以下命令可以開始一次重新分片操作:

./redis-trib.rb reshard 127.0.0.1:7000

你只需要指定集羣中其中一個節點的地址, redis-trib 就會自動找到集羣中的其他節點。

目前 redis-trib 只能在管理員的協助下完成重新分片的工作, 要讓 redis-trib 自動將哈希槽從一個節點移動到另一個節點, 目前來說還做不到

你想移動多少個槽( 從1 到 16384)?

我們嘗試從將100個槽重新分片, 如果 example.rb 程序一直運行着的話, 現在 1000 個槽裏面應該有不少鍵了。

除了移動的哈希槽數量之外, redis-trib 還需要知道重新分片的目標, 也即是, 負責接收這 1000 個哈希槽的節點。

$ redis-cli -p 7000 cluster nodes | grep myself
97a3a64667477371c4479320d683e4c8db5858b1 :0 myself,master - 0 0 0 connected 0-5460

我的目標節點是 97a3a64667477371c4479320d683e4c8db5858b1.

現在需要指定從哪些節點來移動keys到目標節點 我輸入的是all ,這樣就會從其他每個master上取一些哈希槽。

最後確認後你將會看到每個redis-trib移動的槽的信息,每個key的移動的信息也會打印出來 在重新分片的過程中,你的例子程序是不會受到影響的,你可以停止或者重新啓動多次。

在重新分片結束後你可以通過如下命令檢查集羣狀態:

./redis-trib.rb check 127.0.0.1:7000

一個更有趣的程序

我們在前面使用的示例程序 example.rb 並不是十分有趣, 因爲它只是不斷地對集羣進行寫入, 但並不檢查寫入結果是否正確。 比如說, 集羣可能會錯誤地將 example.rb 發送的所有 SET 命令都改成了 SET foo 42 , 但因爲 example.rb 並不檢查寫入後的值, 所以它不會意識到集羣實際上寫入的值是錯誤的 因爲這個原因, redis-rb-cluster 項目包含了一個名爲 consistency-test.rb 的示例應用, 這個應用比起 example.rb 有趣得多: 它創建了多個計數器(默認爲 1000 個), 並通過發送 INCR 命令來增加這些計數器的值。

在增加計數器值的同時, consistency-test.rb 還執行以下操作: 每次使用 INCR 命令更新一個計數器時, 應用會記錄下計數器執行 INCR 命令之後應該有的值。 舉個例子, 如果計數器的起始值爲 0 , 而這次是程序第 50 次向它發送 INCR 命令, 那麼計數器的值應該是 50 。

在每次發送 INCR 命令之前, 程序會隨機從集羣中讀取一個計數器的值, 並將它與自己記錄的值進行對比, 看兩個值是否相同。

換句話說, 這個程序是一個一致性檢查器(consistency checker): 如果集羣在執行 INCR 命令的過程中, 丟失了某條 INCR 命令, 又或者多執行了某條客戶端沒有確認到的 INCR 命令, 那麼檢查器將察覺到這一點 —— 在前一種情況中, consistency-test.rb 記錄的計數器值將比集羣記錄的計數器值要大; 而在後一種情況中, consistency-test.rb 記錄的計數器值將比集羣記錄的計數器值要小。

運行 consistency-test 程序將產生類似以下的輸出:

$ ruby consistency-test.rb
925 R (0 err) | 925 W (0 err) |
5030 R (0 err) | 5030 W (0 err) |
9261 R (0 err) | 9261 W (0 err) |
13517 R (0 err) | 13517 W (0 err) |
17780 R (0 err) | 17780 W (0 err) |
22025 R (0 err) | 22025 W (0 err) |
25818 R (0 err) | 25818 W (0 err) |

結果展示了執行的讀和 寫,和錯誤(由於系統不可用而沒有接受的查詢發生的錯誤)的數量.

如果程序察覺了不一致的情況出現, 它將在輸出行的末尾顯式不一致的詳細情況。比如說, 如果我們在 consistency-test.rb 運行的過程中, 手動修改某個計數器的值:

$ redis 127.0.0.1:7000> set key_217 0
OK

(in the other tab I see...)

94774 R (0 err) | 94774 W (0 err) |
98821 R (0 err) | 98821 W (0 err) |
102886 R (0 err) | 102886 W (0 err) | 114 lost |
107046 R (0 err) | 107046 W (0 err) | 114 lost |

在我們修改計數器值的時候, 計數器的正確值是 114 (執行了 114 次 INCR 命令), 因爲我們將計數器的值設成了 0 , 所以 consistency-test.rb 會向我們報告說丟失了 114 個 INCR 命令。

這個程序作爲測試程序很有意思,所以我們用這個程序來測試故障恢復.

測試故障轉移

在執行本節操作的過程中, 請一直運行 consistency-test 程序。 要觸發一次故障轉移, 最簡單的辦法就是令集羣中的某個主節點進入下線狀態。首先用以下命令列出集羣中的所有主節點:

$ redis-cli -p 7000 cluster nodes | grep master
3e3a6cb0d9a9a87168e266b0a0b24026c0aae3f0 127.0.0.1:7001 master - 0 1385482984082 0 connected 5960-10921
2938205e12de373867bf38f1ca29d31d0ddb3e46 127.0.0.1:7002 master - 0 1385482983582 0 connected 11423-16383
97a3a64667477371c4479320d683e4c8db5858b1 :0 myself,master - 0 0 0 connected 0-5959 10922-11422

通過命令輸出得知端口號爲 7000 、 7001 和 7002 的節點都是主節點, 然後我們可以通過向端口號爲7002 的主節點發送 DEBUG SEGFAULT 命令, 讓這個主節點崩潰:

$ redis-cli -p 7002 debug segfault
Error: Server closed the connection

現在,切換到運行着 consistency-test 的標籤頁, 可以看到, consistency-test 在 7002 下線之後的一段時間裏將產生大量的錯誤警告信息:

18849 R (0 err) | 18849 W (0 err) |
23151 R (0 err) | 23151 W (0 err) |
27302 R (0 err) | 27302 W (0 err) |

... many error warnings here ...

29659 R (578 err) | 29660 W (577 err) |
33749 R (578 err) | 33750 W (577 err) |
37918 R (578 err) | 37919 W (577 err) |
42077 R (578 err) | 42078 W (577 err) |

從 consistency-test 的這段輸出可以看到, 集羣在執行故障轉移期間, 總共丟失了 578 個讀命令和 577 個寫命令, 但是並沒有產生任何數據不一致。這聽上去可能有點奇怪, 因爲在教程的開頭我們提到過, Redis 使用的是異步複製, 在執行故障轉移期間, 集羣可能會丟失寫命令。但是在實際上, 丟失命令的情況並不常見, 因爲 Redis 幾乎是同時執行將命令回覆發送給客戶端, 以及將命令複製給從節點這兩個操作, 所以實際上造成命令丟失的時間窗口是非常小的。不過, 儘管出現的機率不高, 但丟失命令的情況還是有可能會出現的, 所以我們對 Redis 集羣不能提供強一致性的這一描述仍然是正確的。現在, 讓我們使用 cluster nodes 命令,查看集羣在執行故障轉移操作之後, 主從節點的佈局情況:

$ redis-cli -p 7000 cluster nodes
3fc783611028b1707fd65345e763befb36454d73 127.0.0.1:7004 slave 3e3a6cb0d9a9a87168e266b0a0b24026c0aae3f0 0 1385503418521 0 connected
a211e242fc6b22a9427fed61285e85892fa04e08 127.0.0.1:7003 slave 97a3a64667477371c4479320d683e4c8db5858b1 0 1385503419023 0 connected
97a3a64667477371c4479320d683e4c8db5858b1 :0 myself,master - 0 0 0 connected 0-5959 10922-11422
3c3a0c74aae0b56170ccb03a76b60cfe7dc1912e 127.0.0.1:7005 master - 0 1385503419023 3 connected 11423-16383
3e3a6cb0d9a9a87168e266b0a0b24026c0aae3f0 127.0.0.1:7001 master - 0 1385503417005 0 connected 5960-10921
2938205e12de373867bf38f1ca29d31d0ddb3e46 127.0.0.1:7002 slave 3c3a0c74aae0b56170ccb03a76b60cfe7dc1912e 0 1385503418016 3 connected

現在masters運行在 7000, 7001 和 7005端口上. 原來的master 7002現在變成了一個7005的一個從節點.

CLUSTER NODES 命令的輸出看起來有點複雜,其實他非常的簡單,含義如下:

  • 節點ID
  • IP:端口
  • 標誌: master, slave, myself, fail, …
  • 如果是個從節點, 這裏是它的主節點的NODE ID
  • 集羣最近一次向節點發送 PING 命令之後, 過去了多長時間還沒接到回覆。.
  • 節點最近一次返回 PONG 回覆的時間。
  • 節點的配置紀元(configuration epoch):詳細信息請參考 Redis 集羣規範 。
  • 本節點的網絡連接情況:例如 connected 。
  • 節點目前包含的槽:例如 127.0.0.1:7001 目前包含號碼爲 5960 至 10921 的哈希槽。

手動故障轉移

有的時候在主節點沒有任何問題的情況下強制手動故障轉移也是很有必要的,比如想要升級主節點的Redis進程,我們可以通過故障轉移將其轉爲slave再進行升級操作來避免對集羣的可用性造成很大的影響。

Redis集羣使用 CLUSTER FAILOVER命令來進行故障轉移,不過要被轉移的主節點的從節點上執行該命令 手動故障轉移比主節點失敗自動故障轉移更加安全,因爲手動故障轉移時客戶端的切換是在確保新的主節點完全複製了失敗的舊的主節點數據的前提下下發生的,所以避免了數據的丟失。

執行手動故障轉移時從節點日誌如下:

# Manual failover user request accepted.
# Received replication offset for paused master manual failover: 347540
# All master replication stream processed, manual failover can start.
# Start of election delayed for 0 milliseconds (rank #0, offset 347540).
# Starting a failover election for epoch 7545.
# Failover election won: I'm the new master.

其基本過程如下:客戶端不再鏈接我們淘汰的主節點,同時主節點向從節點發送複製偏移量,從節點得到複製偏移量後故障轉移開始,接着通知主節點進行配置切換,當客戶端在舊的master上解鎖後重新連接到新的主節點上。

添加一個新節點

添加新的節點的基本過程就是添加一個空的節點然後移動一些數據給它,有兩種情況,添加一個主節點和添加一個從節點(添加從節點時需要將這個新的節點設置爲集羣中某個節點的複製)

針對這兩種情況,本節都會介紹,先從添加主節點開始.

兩種情況第一步都是要添加 一個空的節點.

啓動新的7006節點,使用的配置文件和以前的一樣,只要把端口號改一下即可,過程如下:

  • 在終端打開一個新的標籤頁.
  • 進入cluster-test 目錄.
  • 創建並進入 7006文件夾.
  • 和其他節點一樣,創建redis.conf文件,需要將端口號改成7006.
  • 最後啓動節點 ../redis-server ./redis.conf
  • 如果正常的話,節點會正確的啓動.

接下來使用redis-trib 來添加這個節點到現有的集羣中去.

./redis-trib.rb add-node 127.0.0.1:7006 127.0.0.1:7000

可以看到.使用addnode命令來添加節點,第一個參數是新節點的地址,第二個參數是任意一個已經存在的節點的IP和端口. 我們可以看到新的節點已經添加到集羣中:

redis 127.0.0.1:7006> cluster nodes
3e3a6cb0d9a9a87168e266b0a0b24026c0aae3f0 127.0.0.1:7001 master - 0 1385543178575 0 connected 5960-10921
3fc783611028b1707fd65345e763befb36454d73 127.0.0.1:7004 slave 3e3a6cb0d9a9a87168e266b0a0b24026c0aae3f0 0 1385543179583 0 connected
f093c80dde814da99c5cf72a7dd01590792b783b :0 myself,master - 0 0 0 connected
2938205e12de373867bf38f1ca29d31d0ddb3e46 127.0.0.1:7002 slave 3c3a0c74aae0b56170ccb03a76b60cfe7dc1912e 0 1385543178072 3 connected
a211e242fc6b22a9427fed61285e85892fa04e08 127.0.0.1:7003 slave 97a3a64667477371c4479320d683e4c8db5858b1 0 1385543178575 0 connected
97a3a64667477371c4479320d683e4c8db5858b1 127.0.0.1:7000 master - 0 1385543179080 0 connected 0-5959 10922-11422
3c3a0c74aae0b56170ccb03a76b60cfe7dc1912e 127.0.0.1:7005 master - 0 1385543177568 3 connected 11423-16383

新節點現在已經連接上了集羣, 成爲集羣的一份子, 並且可以對客戶端的命令請求進行轉向了, 但是和其他主節點相比, 新節點還有兩點區別:

  • 新節點沒有包含任何數據, 因爲它沒有包含任何哈希槽.
  • 儘管新節點沒有包含任何哈希槽, 但它仍然是一個主節點, 所以在集羣需要將某個從節點升級爲新的主節點時, 這個新節點不會被選中。

接下來, 只要使用 redis-trib 程序, 將集羣中的某些哈希桶移動到新節點裏面, 新節點就會成爲真正的主節點了。

添加一個從節點

有兩種方法添加從節點,可以像添加主節點一樣使用redis-trib 命令,也可以像下面的例子一樣使用 –slave選項:

./redis-trib.rb add-node --slave 127.0.0.1:7006 127.0.0.1:7000

此處的命令和添加一個主節點命令類似,此處並沒有指定添加的這個從節點的主節點,這種情況下系統會在其他的複製集中的主節點中隨機選取一個作爲這個從節點的主節點。

你可以通過下面的命令指定主節點:

./redis-trib.rb add-node --slave --master-id 3c3a0c74aae0b56170ccb03a76b60cfe7dc1912e 127.0.0.1:7006 127.0.0.1:7000

也可以使用CLUSTER REPLICATE 命令添加.這個命令也可以改變一個從節點的主節點。

例如,要給主節點 127.0.0.1:7005添加一個從節點,該節點哈希槽的範圍1423-16383, 節點 ID 3c3a0c74aae0b56170ccb03a76b60cfe7dc1912e,我們需要鏈接新的節點(已經是空的主節點)並執行命令:

redis 127.0.0.1:7006> cluster replicate 3c3a0c74aae0b56170ccb03a76b60cfe7dc1912e

我們新的從節點有了一些哈希槽,其他的節點也知道(過幾秒後會更新他們自己的配置),可以使用如下命令確認:

$ redis-cli -p 7000 cluster nodes | grep slave | grep 3c3a0c74aae0b56170ccb03a76b60cfe7dc1912e
f093c80dde814da99c5cf72a7dd01590792b783b 127.0.0.1:7006 slave 3c3a0c74aae0b56170ccb03a76b60cfe7dc1912e 0 1385543617702 3 connected
2938205e12de373867bf38f1ca29d31d0ddb3e46 127.0.0.1:7002 slave 3c3a0c74aae0b56170ccb03a76b60cfe7dc1912e 0 1385543617198 3 connected

節點 3c3a0c… 有兩個從節點, 7002 (已經存在的) 和 7006 (新添加的).

移除一個節點

只要使用 del-node 命令即可:

./redis-trib del-node 127.0.0.1:7000 `<node-id>`

第一個參數是任意一個節點的地址,第二個節點是你想要移除的節點地址。

使用同樣的方法移除主節點,不過在移除主節點前,需要確保這個主節點是空的. 如果不是空的,需要將這個節點的數據重新分片到其他主節點上.

替代移除主節點的方法是手動執行故障恢復,被移除的主節點會作爲一個從節點存在,不過這種情況下不會減少集羣節點的數量,也需要重新分片數據.

從節點的遷移

在Redis集羣中會存在改變一個從節點的主節點的情況,需要執行如下命令 :

CLUSTER REPLICATE <master-node-id>

在特定的場景下,不需要系統管理員的協助下,自動將一個從節點從當前的主節點切換到另一個主節 的自動重新配置的過程叫做複製遷移(從節點遷移),從節點的遷移能夠提高整個Redis集羣的可用性.

你可以閱讀(Redis集羣規範)/topics/cluster-spec瞭解細節.

簡短的概況一下從節點遷移

  • 集羣會在有從節點數量最多的主節點上進行從節點的遷移.
  • 要在一個主節點上添加多個從節點.
  • 參數來控制從節點遷移 replica-migration-barrier:你可以仔細閱讀redis.conf 。

轉載地址:官網搭建集羣  cluster 集羣規則​​​​​​​

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章