Redis持久化詳解

前言

    在Redis數據庫中,我們知道Redis不僅是將數據保存到內存中,而且要將數據同步到磁盤中,這也就是Redis和Memcache的區別之一,這也就是Redis的持久化,Redis的持久化有RDB和AOF兩種方式,下面讓我們具體瞭解一下。

一、Redis持久化方式

RDB 持久化可以在指定的時間間隔內生成數據集的時間點快照(point-in-time snapshot)。

AOF 持久化記錄服務器執行的所有寫操作命令,並在服務器啓動時,通過重新執行這些命令來還原數據集。

二、Redis持久化方式對比

RDB優點:

  • RDB 是一個非常緊湊(compact)的文件,它保存了 Redis 在某個時間點上的數據集。
    這種文件非常適合用於進行備份,災難恢復等場景

  • RDB 可以最大化 Redis 的性能:父進程在保存 RDB 文件時唯一要做的就是 fork 出一個子進程,然後這個子進程就會處理接下來的所有保存工作,父進程無須執行任何磁盤 I/O 操作。

  • RDB 在恢復大數據集時的速度比 AOF 的恢復速度要快。

RDB缺點:

  • 如果你需要儘量避免在服務器故障時丟失數據,那麼 RDB 不適合你。
    雖然 Redis 允許你設置不同的保存點(save point)來控制保存 RDB 文件的頻率,但是,因爲RDB 文件需要保存整個數據集的狀態,所以它並不是一個輕鬆的操作。因此你可能會至少 5 分鐘才保存一次 RDB 文件。在這種情況下,一旦發生故障停機,你就可能會丟失好幾分鐘的數據。

  • 每次保存 RDB 的時候,Redis 都要 fork() 出一個子進程,並由子進程來進行實際的持久化工作。
    在數據集比較龐大時, fork() 可能會非常耗時,造成服務器在某某毫秒內停止處理客戶端;
    如果數據集非常巨大,並且 CPU 時間非常緊張的話,那麼這種停止時間甚至可能會長達整整一秒。
    雖然 AOF 重寫也需要進行 fork() ,但無論 AOF 重寫的執行間隔有多長,數據的耐久性都不會有任何損失。

AOF優點:

  • 使用 AOF 持久化默認策略爲每秒鐘 fsync 一次,在這種配置下,Redis 仍然可以保持良好的性能,並且就算髮生故障停機,也最多隻會丟失一秒鐘的數據( fsync 會在後臺線程執行,所以主線程可以繼續努力地處理命令請求)。

  • AOF 文件是一個只進行追加操作的日誌文件(append only log),
    因此對 AOF 文件的寫入不需要進行 seek ,
    即使日誌因爲某些原因而包含了未寫入完整的命令(比如寫入時磁盤已滿,寫入中途停機,等),redis-check-aof 工具也可以輕易地修復這種問題。

  • Redis 可以在 AOF 文件體積變得過大時,自動地在後臺對 AOF 進行重寫:
    重寫後的新 AOF 文件包含了恢復當前數據集所需的最小命令集合。
    整個重寫操作是絕對安全的,因爲 Redis 在創建新 AOF 文件的過程中,會繼續將命令追加到現有的 AOF 文件裏面,即使重寫過程中發生停機,現有的 AOF 文件也不會丟失。
    而一旦新 AOF 文件創建完畢,Redis 就會從舊 AOF 文件切換到新 AOF 文件,並開始對新 AOF 文件進行追加操作。

  • AOF 文件有序地保存了對數據庫執行的所有寫入操作,這些寫入操作以 Redis 協議的格式保存,
    因此 AOF 文件的內容非常容易被人讀懂,對文件進行分析也很輕鬆。導出 AOF 文件也非常簡單

AOF缺點:

  • 對於相同的數據集來說,AOF 文件的體積通常要大於 RDB 文件的體積。

  • 根據所使用的 fsync 策略,AOF 的速度可能會慢於 RDB 。在一般情況下,每秒 fsync 的性能依然非常高,而關閉 fsync 可以讓 AOF 的速度和 RDB 一樣快,即使在高負荷之下也是如此。不過在處理巨大的寫入載入時,RDB 可以提供更有保證的最大延遲時間(latency)。

  • AOF 在過去曾經發生過這樣的 bug :因爲個別命令的原因,導致 AOF 文件在重新載入時,無法將數據集恢復成保存時的原樣。(舉個例子,阻塞命令就曾經引起過這樣的 bug 。)測試套件裏爲這種情況添加了測試:它們會自動生成隨機的、複雜的數據集,並通過重新載入這些數據來確保一切正常。雖然這種 bug 在 AOF 文件中並不常見,但是對比來說,RDB 幾乎是不可能出現這種 bug 的。

三、RDB保存數據過程

  1. Redis 調用 fork() 子進程,同時擁有父進程和子進程。

  2. 子進程將數據集寫入到一個臨時 RDB 文件中。

  3. 當子進程完成對新 RDB 文件的寫入時,Redis 用新 RDB 文件替換原來的 RDB 文件,並刪除舊的 RDB 文件

四、RDB快照的配置

在redis的配置文件 redis.conf中

save 60 1000

註釋:在60 秒內有至少有 1000 個鍵被改動,就保存一次數據

在默認情況下,Redis 將數據庫快照保存在名字爲 dump.rdb 的二進制文件中。

五、AOF持久化過程

  1. Redis 執行 fork() ,現在同時擁有父進程和子進程。

  2. 子進程開始將新 AOF 文件的內容寫入到臨時文件。

  3. 對於所有新執行的寫入命令,父進程一邊將它們累積到一個內存緩存中,一邊將這些改動追加到現有 AOF 文件的末尾:
    這樣即使在重寫的中途發生停機,現有的 AOF 文件也還是安全的。

  4. 當子進程完成重寫工作時,它給父進程發送一個信號,父進程在接收到信號之後,將內存緩存中的所有數據追加到新 AOF 文件的末尾。

  5. 現在 Redis 原子地用新文件替換舊文件,之後所有命令都會直接追加到新 AOF 文件的末尾。

六、AOF持久化配置

[root@tshare365 ~]# grep append /etc/redis.conf 
#       At the date of writing these commands are: set setnx setex append
appendonly no
# The name of the append only file (default: "appendonly.aof")
appendfilename "appendonly.aof"
# always: fsync after every write to the append only log. Slow, Safest.
# appendfsync always
appendfsync everysec
# appendfsync no
# the same as "appendfsync none". In practical terms, this means that it is
no-appendfsync-on-rewrite no
# Automatic rewrite of the append only file.

將appendonly on 改爲yes之後AOF持久化化就配置完成了,是不是感覺很簡單。哈哈,配置都很簡單關鍵是理論知識都應該理解。

通過配置文件我們看到AOF的默認fsync策略有三個選項

appendfsync always  #每次有新命令追加到 AOF 文件時就執行一次 fsync
appendfsync everysec #每秒執行一次fsync
appendfsync no       #從不執行fsync

好 了 到此做一個總結,Redis有兩種持久化方式,上面詳細的對比了兩種的優缺點,讀者可以更具業務的需要合理的選擇適合自己的持久化方式,個人感覺 AOF有點像是mysql中的二進制日誌,都是不保存數據只是記錄下來執行的命令,本博文到此結束,如果有什麼問題請留言!


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章