redis哨兵——(22)主備切換的數據丟失問題:異步複製、集羣腦裂

問題

兩種數據丟失的情況

解決異步複製和腦裂導致的數據丟失

一、兩種數據丟失的情況

主備切換的過程,可能會導致數據丟失

  1. 異步複製導致的數據丟失

因爲master -> slave的複製是異步的,所以可能有部分數據還沒複製到slave,master就宕機了,此時這些部分數據就丟失了
在這裏插入圖片描述
在舊的master node那裏內存裏的那些數據,還沒來得及給slave node 就掛掉了 。
slave node 成了master node
那些舊的master node中的數據不就丟失了嗎?

  1. 腦裂導致的數據丟失

腦裂,也就是說,某個master所在機器突然脫離了正常的網絡,跟其他slave機器不能連接,但是實際上master還運行着

此時哨兵可能就會認爲master宕機了,然後開啓選舉,將其他slave切換成了master

這個時候,集羣裏就會有兩個master,也就是所謂的腦裂

此時雖然某個slave被切換成了master,但是可能client還沒來得及切換到新的master,還繼續寫向舊master的數據可能也丟失了

因此舊master再次恢復的時候,會被作爲一個slave掛到新的master上去,自己的數據會清空,重新從新的master複製數據
在這裏插入圖片描述

二、解決解決異步複製和腦裂導致的數據丟失

在redis的配置文件redis.conf中。默認在安裝目錄下,我的改名放在了/etc/redis/6379.conf 有兩個參數配置
min-slaves-to-write 1
min-slaves-max-lag 10

要求至少有1個slave,數據複製和同步的延遲不能超過10秒

如果說一旦所有的slave,數據複製和同步的延遲都超過了10秒鐘,那麼這個時候,master就不會再接收任何請求了

上面兩個配置可以減少異步複製和腦裂導致的數據丟失

  1. 減少異步複製的數據丟失
    有了min-slaves-max-lag這個配置,就可以確保說,一旦slave複製數據和ack延時太長,就認爲可能master宕機後損失的數據太多了,那麼就拒絕寫請求,這樣可以把master宕機時由於部分數據未同步到slave導致的數據丟失降低的可控範圍內
    圖解:
    在這裏插入圖片描述
  2. 減少腦裂的數據丟失
    如果一個master出現了腦裂,跟其他slave丟了連接,那麼上面兩個配置可以確保說,如果不能繼續給指定數量的slave發送數據,而且slave超過10秒沒有給自己ack消息,那麼就直接拒絕客戶端的寫請求

這樣腦裂後的舊master就不會接受client的新數據,也就避免了數據丟失

上面的配置就確保了,如果跟任何一個slave丟了連接,在10秒後發現沒有slave給自己ack,那麼就拒絕新的寫請求
因此在腦裂場景下,最多就丟失10秒的數據

圖解:
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章