一、什麼是Redis主從複製？

主從複製就是現在有兩臺redis服務器，把一臺redis的數據同步到另一臺redis數據庫上。前者稱之爲主節點（master），後者爲從節點（slave）。數據是隻能master往slave同步單向。

但是在實際過程中是不可能只有倆臺redis服務器來做主從複製的，這也就意味着每臺redis服務器都有可能會稱爲主節點（master）

下圖案例中，我們的slave3既是master的從節點，也是slave的主節點。

先知道這麼個概念，更多詳解繼續查看下文。

二、爲什麼需要Redis主從複製？

假設我們現在就一臺redis服務器，也就是單機狀態。

在這種情況下會出現的第一個問題就是服務器宕機，直接導致數據丟失。如果項目是跟￥佔關係的，那造成的後果就可想而知。

第二個情況就是內存問題了，當只有一臺服務器時內存肯定會到達峯值的，不可能對一臺服務器進行無限升級的。

所以針對以上倆個問題，我們就多準備幾臺服務器，配置主從複製。將數據保存在多個服務器上。並且保證每個服務器的數據是同步的。即使有一個服務器宕機了，也不會影響用戶的使用。redis可以繼續實現高可用、同時實現數據的冗餘備份。

這會應該會有很多疑問，master跟slave怎麼連接呢？如何同步數據呢？假如master服務器宕機了呢？彆着急，一點一點解決你的問題。

三、Redis主從複製的作用

在上邊我們說了爲什麼使用redis的主從複製，那麼主從複製的作用就是針對爲什麼使用它來講了。

我們繼續使用這個圖來談論
第一點是數據冗餘了，實現了數據的熱備份，是持久化之外的另一種方式。
第二點是針對單機故障問題。當主節點也就是master出現問題時，可以由從節點來提供服務也就是slave，實現了快速恢復故障，也就是服務冗餘。
第三點是讀寫分離，master服務器主要是寫，slave主要用來讀數據，可以提高服務器的負載能力。同時可以根據需求的變化，添加從節點的數量。
第四點是負載均衡，配合讀寫分離，有主節點提供寫服務，從節點提供讀服務，分擔服務器負載，尤其在寫少讀多的情況下，通過多個從節點分擔讀負載，可以大大提高redis服務器的併發量和負載。
第五點是高可用的基石，主從複製是哨兵和集羣能夠實施的基礎，因此我們可以說主從複製是高可用的基石。

四、配置Redis主從複製

說了這麼多，我們先簡單的配置一個主從複製案例，然後在談實現的原理。

redis存儲路徑爲：usr/local/redis

日誌跟配置文件存儲在：usr/local/redis/data

首先我們先配置倆個配置文件，分別爲redis6379.conf 和 redis6380.conf

修改配置文件，主要就是修改端口。爲了查看方便在把日誌文件和持久化文件的名字都用各自的端口來做標識。

然後分別開啓倆個redis服務，一個端口爲6379，一個端口爲6380。執行命令redis-server redis6380.conf,然後使用redis-cli -p 6380連接，因爲redis的默認端口就是6379所以我們啓動另外一臺redis服務器直接使用redis-server redis6379.conf 然後直接使用redis-cli直接連接就可以。

這個時候我們就成功的配置了倆個redis服務，一臺爲6380，一臺爲6379，這裏只是爲了演示。實際工作中是需要配置在倆臺不同的服務器的。

1. 使用客戶端命令行啓動

我們先得有一個概念，就是在配置主從複製時，所有的操作都是在從節點來操作，也就是slave。

那麼我們在從節點執行一個命令爲 slaveof 127.0.0.1 6379，執行完就代表我們連接上了。

我們先測試一下看是否實現主從複製。在master這臺服務器上執行倆個set kaka 123 和 set master 127.0.0.1，然後在slave6380端口是可以成功獲取到的，也就說明我們的主從複製就已經配置完成了。但是在實現生產環境可不是就這樣完事了，後邊會在進一步對主從複製進行優化，直到實現高可用。

2. 使用配置文件啓用

在使用配置文件啓動主從複製之前呢！先需要把之前使用客戶端命令行連接的斷開，再從主機執行slaveof no one即可斷開主從複製。

在哪可以查看從節點已經斷開了主節點呢！在主節點的客戶端輸入命令行info查看

這張圖是使用從節點使用客戶端命令行連接主節點後，在主節點的客戶端輸入info打印的信息，可以看到有一個slave0的一個信息。

這個圖是在從節點執行完slaveof no one 後，在主節點打印的info，說明從節點已經跟主節點斷開連接了。

在根據配置文件啓動redis服務，redis-server redis6380.conf

當在從節點重新啓動後就可以在主節點直接查看到從節點的連接信息。

測試數據，主節點寫的東西，從節點還是會自動同步的。

3. 啓動redis服務器時啓動

這種方式配置也是很簡單，在啓動redis服務器時直接就啓動主從複製，執行命令：redis-server --slaveof host port 即可。

4. 主從複製啓動後的日誌信息查看

這個是主節點的日誌信息

這個是從節點的信息，其中有連接主節點信息，還有RDB快照保存。

五、主從複製工作原理

1. 主從複製的三個階段

主從複製完整的工作流程分爲以下三個階段。每一段都有自己的內部工作流程，那麼我們會對這三個過程進行談論。

建立連接過程：這個過程就是slave跟master連接的過程
數據同步過程：是master給slave同步數據的過程
命令傳播過程：是反覆同步數據

2. 第一階段：建立連接過程

上圖是一個完整主從複製建立連接工作流程。然後使用簡短的話語來描述上邊的工作流程。

設置master的地址和端口，保存master的信息
建立socket連接（這個連接做的事情下文會說）
持續發送ping命令
身份驗證
發送slave端口信息

在建立連接的過程中，從節點會保存master的地址和端口、主節點master保存從節點slave的端口。

3. 第二階段：數據同步階段過程

這張圖是詳細描述第一次從節點連接主節點時的數據同步過程。

當從節點第一次連接主節點時，先會執行一次全量複製這次的全量複製是無法避免的。

全量複製執行完成後，主節點就會發送複製積壓緩衝區的數據，然後從節點就會執行bgrewriteaof恢復數據，這也就是部分複製。

在這個階段提到了三個新點，全量複製、部分複製、複製緩衝積壓區。會在下文的常見問題裏詳細說明這幾個點。

4. 第三階段：命令傳播階段

當master數據庫被修改後，主從服務器的數據不一致後，此時就會讓主從數據同步到一致，這個過程稱之爲命令傳播。

master會將接收到的數據變更命令發送給slave，slave接收命令後執行命令，讓主從數據達到一致。

命令傳播階段的部分複製

在命令傳播階段出現斷網的情況，或者網絡抖動時會導致連接斷開（connection lost）
這個時候主節點master還是會繼續往replbackbuffer（複製緩衝積壓區）寫數據
從節點會繼續嘗試連接主機（connect to master）
當從節點把自己的runid和複製偏移量發送給主節點，並且執行pysnc命令同步
如果master判斷偏移量是在複製緩衝區範圍內，就會返回continue命令。並且發送複製緩衝區的數據給從節點。
從節點接收數據執行bgrewriteaof，恢復數據

六. 詳細介紹主從複製原理（全量複製+部分複製）

這個過程就是主從複製最齊全的流程講解。那麼下來我們對每一步進程簡單的介紹

從節點發送指令psync ? 1 psync runid offset 找對應的runid索取數據。但是這裏可以考慮一下，當從節點第一次連接的時候根本就不知道主節點的runid 和 offset 。所以第一次發送的指令是psync ？ 1意思就是主節點的數據我全要。
主節點開始執行bgsave生成RDB文件，記錄當前的複製偏移量offset
主節點這個時候會把自己的runid 和 offset 通過 +FULLRESYNC runid offset 指令通過socket發送RDB文件給從節點。
從節點接收到+FULLRESYNC 保存主節點的runid和offset 然後清空當前所有數據，通過socket接收RDB文件，開始恢復RDB數據。
在全量複製後，從節點已經獲取到了主節點的runid和offset，開始發送指令 psync runid offset
主節點接收指令，判斷runid是否匹配，判斷offset是否在複製緩衝區中。
主節點判斷runid和offset有一個不滿足，就會在返回到步驟2繼續執行全量複製。這裏的runid不匹配只有的可能是從節點重啓了這個問題後邊會解決，offset（偏移量）不匹配就是複製積壓緩衝區溢出了。如果runid或offset校驗通過，從節點的offset和主節點的offset相同時則忽略。如果runid或offset檢驗通過，從節點的offset與offset不相同，則會發送 +CONTINUE offset(這個offset爲主節點的)，通過socket發送複製緩衝區中從節點offset到主節點offset的數據。
從節點收到+CONTINUE 保存master的offset 通過socket接收到信息後，執行bgrewriteaof，恢復數據。

1-4是全量複製 5-8是部分複製

在主節點的第3步下面主節點在主從複製的期間是一直在接收客戶端的數據，主節點的offset是一直變化的。只有有變化就會給每個slave進行發送，這個發送的過程稱之爲心跳機制

七. 心跳機制

在命令傳播階段是，主節點與從節點之間一直都需要進行信息互換，使用心跳機制進行維護，實現主節點和從節點連接保持在線。

master心跳指令：ping 默認10秒進行一次，是由參數repl-ping-slave-period決定的主要做的事情就是判斷從節點是否在線可以使用info replication 來查看從節點租後一次連接時間的間隔，lag爲0或者爲1就是正常狀態。
slave心跳任務指令：replconf ack {offset} 每秒執行一次主要做的事情是給主節點發送自己的複製偏移量，從主節點獲取到最新的數據變更命令，還做一件事情就是判斷主節點是否在線。

心跳階段的注意事項 主節點爲保障數據穩定性，當從節點掛掉的數量或者延遲過高時。將會拒絕所有信息同步。

這裏有倆個參數可以進行配置調整：

min-slaves-to-write 2

min-slaves-max-lag 8

這倆個參數表示從節點的數量就剩餘2個，或者從節點的延遲大於8秒時，主節點就會強制關閉maste功能，停止數據同步。

那麼主節點是如何知道從節點掛掉的數量和延遲時間呢！在心跳機制裏邊slave 會每隔一秒發送perlconf ack 這個指令，這個指令可攜帶偏移量，也可以攜帶從節點的延遲時間和從節點的數量。

八、部分複製的三個核心要素

1. 服務器的運行id （run id）

我們先看一下這個run id是什麼，執行info命令即可看到。在上文中我們查看啓動日誌信息也可以看到。

redis在啓動時會自動生成一個隨機的id（這裏需要注意的是每次啓動的id都會不一樣），是由40個隨機的十六進制字符串組成，用來唯一識別一個redis節點。

在主從複製初次啓動時，master會把自己的runid發送給slave，slave會保存master的這個id，我們可以使用info命令查看

當斷線重連時，slave把這個id發送給master，如果slave保存的runid與master現在的runid相同，master會嘗試使用部分複製（這塊能否複製成功還有一個因素就是偏移量）。如果slave保存的runid與master現在的runid不同，則會直接進行全量複製。

2. 複製積壓緩衝區

複製緩衝積壓區是一個先進先出的隊列，用戶存儲master收集數據的命令記錄。複製緩衝區的默認存儲空間是1M。

可以在配置文件修改repl-backlog-size 1mb來控制緩衝區大小，這個比例可以根據自己的服務器內存來修改，咔咔這邊是預留出了30%左右。

複製緩衝區到底存儲的是什麼？

當執行一個命令爲set name kaka時，我們可以查看持久化文件查看

那麼複製積壓緩衝區就是存儲的aof持久化的數據，並且以字節分開，並且每個字節都有自己的偏移量。這個偏移量也就是複製偏移量（offset）

那爲什麼會說複製緩衝積壓區有可能會導致全量複製呢

在命令傳播階段，主節點會把收集的數據存儲到複製緩衝區中，然後在發送給從節點。就是這裏出現了問題，當主節點數據量在一瞬間特別大的時候，超出了複製緩衝區的內存，就會有一部分數據會被擠出去，從而導致主節點和從節點的數據不一致。從而進行全量複製。如果這個緩衝區大小設置不合理那麼很大可能會造成死循環，從節點就會一直全量複製，清空數據，全量複製。

3. 複製偏移量（offset）

主節點複製偏移量是給從節點發送一次記錄一次，從節點是接收一次記錄一次。

用於同步信息，對比主節點和從節點的差異，當slave斷聯時恢復數據使用。

這個值也就是來自己於複製緩衝積壓區裏邊的那個偏移量。

九. 主從複製常見的問題

1. 主節點重啓問題（內部優化）

當主節點重啓後，runid的值將發生變化，會導致所有的從節點進行全量複製。

這個問題我們無需考慮，知道系統是怎麼優化的即可。

在建立完主從複製後主節點會創建master-replid變量，這個生成的策略跟runid一樣，長度是41位，runid長度是40位，然後發送給從節點。

在主節點執行shutdown save命令時，進行了一次RDB持久化會把runid 和 offset保存到RDB文件中。可以使用命令redis-check-rdb查看該信息。

主節點重啓後加載RDB文件，將文件中的repl-id 和repl-offset加載到內存中。縱使讓所有從節點認爲還是之前的主節點。

2. 從節點網絡中斷偏移量越界導致全量複製

由於網絡環境不佳，從節點網絡中斷。複製積壓緩衝區內存過小導致數據溢出，伴隨着從節點偏移量越界，導致全量複製。有可能會導致反覆的全量複製。

解決方案：修改複製積壓緩衝區的大小：repl-backlog-size

設置建議：測試主節點連接從節點的時間，獲取主節點每秒平均產生的命令總量write_size_per_second

複製緩衝區空間設置 = 2 * 主從連接時間 * 主節點每秒產生的數據總量

3. 頻繁的網絡中斷

由於主節點的cpu佔用過高，或者從節點頻繁連接。出現這種情況造成的結果就是主節點各種資源被嚴重佔用，其中包括但不限於緩衝區，寬帶，連接等。

爲什麼會出現主節點資源被嚴重佔用？

在心跳機制中，從節點每秒會發送一個指令replconf ack指令到主節點。從節點執行了慢查詢，佔用大量的cpu 主節點每秒調用複製定時函數replicationCron，然後從節點長時間沒有相應。

解決方案：

設置從節點超時釋放

設置參數：repl-timeout

這個參數默認爲60秒。超過60秒，釋放slave。

4. 數據不一致問題

由於網絡因素，多個從節點的數據會不一致。這個因素是沒有辦法避免的。

關於這個問題給出倆個解決方案：

第一個數據需要高度一致配置一臺redis服務器，讀寫都用一臺服務器，這種方式僅限於少量數據，並且數據需高度一致。

第二個監控主從節點的偏移量，如果從節點的延遲過大，暫時屏蔽客戶端對該從節點的訪問。設置參數爲slave-serve-stale-data yes|no。這個參數一但設置就只能響應info slaveof等少數命令。

5. 從節點故障

這個問題直接在客戶端維護一個可用節點列表，當從節點故障時，切換到其他節點進行工作，這個問題在後邊集羣會說到。

十. 總結

本文主要講解了什麼是主從複製、主從複製工作的三大階段以及工作流程、部分複製的三大核心。命令傳播階段的心跳機制。最後說明了主從複製常見問題。

寫給大忙人的Redis主從複製，花費五分鐘讓你面試不尷尬