REDIS持久化之RDB和AOF的區別

原文鏈接

稍稍接觸過redis的人都知道redis的兩種持久化方式以及對應的配置。面試中的redis的此類問題,eg:我們都知道redis的幾種持久化方式,請簡述一下他們的區別和優缺點。我們經常接觸,但是如果面試沒做準備的話還是很容易被問懵,其實我最想強調的是,不管你有多少工作經驗,對這些知識點你掌握如何,只要去面試就一定一定得複習全備,因爲這一類得東西我們實際上不常用,至少不可能說是天天用。

我做面試官的時候一般會從幾個緯度來判斷一個人是否能勝任一個崗位:知識面廣度,專業深度,邏輯思維。但是總有一些公司的技術面試習慣性的去用自己的認知去否定別人的認知,一千個讀者就有一千個哈姆雷特,每個人對一個相同的知識點的歸納是不同的,我其實很是討厭此類人,當然此類人往往出現在小公司的情況比較多,先進公司然後當上了小管理,其實大家不用被此類人影響到對知識點的認知。

持久化之RDB

定義:在指定的時間間隔內生成數據集的時間點快照(point-in-time snapshot)

RDB 的優點

1.RDB 是一個非常緊湊(compact)的文件,它保存了 Redis 在某個時間點上的數據集。 這種文件非常適合用於進行備份: 比如說,你可以在最近的 24 小時內,每小時備份一次 RDB 文件,並且在每個月的每一天,也備份一個 RDB 文件。 這樣的話,即使遇上問題,也可以隨時將數據集還原到不同的版本。

2.RDB 非常適用於災難恢復(disaster recovery):它只有一個文件,並且內容都非常緊湊,可以(在加密後)將它傳送到別的數據中心,或者亞馬遜 S3 中。

3.RDB 可以最大化 Redis 的性能:父進程在保存 RDB 文件時唯一要做的就是 fork 出一個子進程,然後這個子進程就會處理接下來的所有保存工作,父進程無須執行任何磁盤 I/O 操作。

4.RDB 在恢復大數據集時的速度比 AOF 的恢復速度要快。

RDB 的缺點

如果你需要儘量避免在服務器故障時丟失數據,那麼 RDB 不適合你。 雖然 Redis 允許你設置不同的保存點(save point)來控制保存 RDB 文件的頻率, 但是, 因爲RDB 文件需要保存整個數據集的狀態, 所以它並不是一個輕鬆的操作。 因此你可能會至少 5 分鐘才保存一次 RDB 文件。 在這種情況下, 一旦發生故障停機, 你就可能會丟失好幾分鐘的數據。

每次保存 RDB 的時候,Redis 都要 fork() 出一個子進程,並由子進程來進行實際的持久化工作。 在數據集比較龐大時, fork() 可能會非常耗時,造成服務器在某某毫秒內停止處理客戶端; 如果數據集非常巨大,並且 CPU 時間非常緊張的話,那麼這種停止時間甚至可能會長達整整一秒。 雖然 AOF 重寫也需要進行 fork() ,但無論 AOF 重寫的執行間隔有多長,數據的耐久性都不會有任何損失。

AOF 的優點

1.使用 AOF 持久化會讓 Redis 變得非常耐久(much more durable):你可以設置不同的 fsync 策略,比如無 fsync ,每秒鐘一次 fsync ,或者每次執行寫入命令時 fsync 。 AOF 的默認策略爲每秒鐘 fsync 一次,在這種配置下,Redis 仍然可以保持良好的性能,並且就算髮生故障停機,也最多隻會丟失一秒鐘的數據( fsync 會在後臺線程執行,所以主線程可以繼續努力地處理命令請求)。

AOF 文件是一個只進行追加操作的日誌文件(append only log), 因此對 AOF 文件的寫入不需要進行 seek , 即使日誌因爲某些原因而包含了未寫入完整的命令(比如寫入時磁盤已滿,寫入中途停機,等等), redis-check-aof 工具也可以輕易地修復這種問題。

Redis 可以在 AOF 文件體積變得過大時,自動地在後臺對 AOF 進行重寫: 重寫後的新 AOF 文件包含了恢復當前數據集所需的最小命令集合。 整個重寫操作是絕對安全的,因爲 Redis 在創建新 AOF 文件的過程中,會繼續將命令追加到現有的 AOF 文件裏面,即使重寫過程中發生停機,現有的 AOF 文件也不會丟失。 而一旦新 AOF 文件創建完畢,Redis 就會從舊 AOF 文件切換到新 AOF 文件,並開始對新 AOF 文件進行追加操作。

AOF 文件有序地保存了對數據庫執行的所有寫入操作, 這些寫入操作以 Redis 協議的格式保存, 因此 AOF 文件的內容非常容易被人讀懂, 對文件進行分析(parse)也很輕鬆。 導出(export) AOF 文件也非常簡單: 舉個例子, 如果你不小心執行了 FLUSHALL 命令, 但只要 AOF 文件未被重寫, 那麼只要停止服務器, 移除 AOF 文件末尾的 FLUSHALL 命令, 並重啓 Redis , 就可以將數據集恢復到 FLUSHALL 執行之前的狀態。

AOF 的缺點

對於相同的數據集來說,AOF 文件的體積通常要大於 RDB 文件的體積。

根據所使用的 fsync 策略,AOF 的速度可能會慢於 RDB 。 在一般情況下, 每秒 fsync 的性能依然非常高, 而關閉 fsync 可以讓 AOF 的速度和 RDB 一樣快, 即使在高負荷之下也是如此。 不過在處理巨大的寫入載入時,RDB 可以提供更有保證的最大延遲時間(latency)。

AOF 在過去曾經發生過這樣的 bug : 因爲個別命令的原因,導致 AOF 文件在重新載入時,無法將數據集恢復成保存時的原樣。 (舉個例子,阻塞命令 BRPOPLPUSH 就曾經引起過這樣的 bug 。) 測試套件裏爲這種情況添加了測試: 它們會自動生成隨機的、複雜的數據集, 並通過重新載入這些數據來確保一切正常。 雖然這種 bug 在 AOF 文件中並不常見, 但是對比來說, RDB 幾乎是不可能出現這種 bug 的。

然後咱以上就是rdb和aof的優缺點,簡單用自己的話來描述一下吧

RDB的優點:簡稱“3更”

1.體積更小:相同的數據量rdb數據比aof的小,因爲rdb是緊湊型文件

2.恢復更快:因爲rdb是數據的快照,基本上就是數據的複製,不用重新讀取再寫入內存

3.性能更高:父進程在保存rdb時候只需要fork一個子進程,無需父進程的進行其他io操作,也保證了服務器的性能。

缺點:

1.故障丟失:因爲rdb是全量的,我們一般是使用shell腳本實現30分鐘或者1小時或者每天對redis進行rdb備份,(注,也可以是用自帶的策略),但是最少也要5分鐘進行一次的備份,所以當服務死掉後,最少也要丟失5分鐘的數據。

2.耐久性差:相對aof的異步策略來說,因爲rdb的複製是全量的,即使是fork的子進程來進行備份,當數據量很大的時候對磁盤的消耗也是不可忽視的,尤其在訪問量很高的時候,fork的時間也會延長,導致cpu喫緊,耐久性相對較差。

aof的優點

1.數據保證:我們可以設置fsync策略,一般默認是everysec,也可以設置每次寫入追加,所以即使服務死掉了,咱們也最多丟失一秒數據

2.自動縮小:當aof文件大小到達一定程度的時候,後臺會自動的去執行aof重寫,此過程不會影響主進程,重寫完成後,新的寫入將會寫到新的aof中,舊的就會被刪除掉。但是此條如果拿出來對比rdb的話還是沒有必要算成優點,只是官網顯示成優點而已。

缺點呢:和rdb相反嘛,畢竟只有兩種。

1.性能相對較差:它的操作模式決定了它會對redis的性能有所損耗

2.體積相對更大:儘管是將aof文件重寫了,但是畢竟是操作過程和操作結果仍然有很大的差別,體積也毋庸置疑的更大。

3.恢復速度更慢:

所以我給出的問題的答案呢:redis有兩種持久化方式,aof和rdb,aof相當於日誌記錄操作命令,rdb相當於數據的快照。安全性來講由於aof的記錄能夠精確到秒級追加甚至逐條追加,而rdb只能是全量複製,aof明顯高於rdb。但是從性能來講rdb就略勝一籌,rdb是redis性能最大化的體現,它不用每秒監控是否有數據寫入,當達到觸發條件後就自動fork一個子進程進行全量更新,速度也很快。容災回覆方面rdb更是能夠快速的恢復數據,而aof需要讀取再寫入,相對慢了很多。

然後面試官就會問你:所以你選擇是什麼?

aof!!!!!!(在中國數據安全是最重要的)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章