Redolog與binlog

數據庫的查詢操作具有天然冪等性，不會對數據庫有任何的修改。但是mysql如何實現對數據庫的更新操作呢？這裏主要有兩種重要的日誌：Redo log和binlog。

Redo log

1、Redo log是引擎層 InnoDB特有的日誌；

2、循環寫，固定空間會用完；

3、屬於物理日誌，記錄的是做了什麼變更；

ps：物理日誌只有具體引擎自己能用，別人沒有共享我的物理格式；

邏輯日誌可以給別的數據庫用，公用的邏輯；

binlog

1、Binlog是MySql Server 層記錄的日誌，所有的存儲引擎都可以使用；

2、可以追加寫，不會覆蓋以前的日誌，用於歸檔；

3、屬於邏輯日誌，記錄的是邏輯操作，是怎麼修改的(sql或者是前後的行記錄)；

binlog的兩種模式：

statement記錄的是sql語句；

row格式記錄的是行的內容，記兩條，改變前和改變後的記錄；一般採用row，但是數據量會變大；

我們通常選擇binlog日誌來作爲replicatio[果採用redo log來實現會更快，但是隻有innodb有，所以binlog必須存在]。

數據庫的性能絕大部分情況下都是由於IO影響了其吞吐量和性能。如果每一次的更新操作都需要寫入磁盤，那麼意味着有一次IO磁盤去查詢，然後更新，這個成本比較大。爲了提高數據庫的吞吐量和降低訪問延時，還有重要的crash-safe能力，這裏引入了重要的日誌模塊：Redo-log。也是經常說的WAL，Wirte-Ahead-Logging, 它的關鍵點是先寫日誌再寫磁盤。
InnoDB有一個buffer pool簡稱(bp)。bp是數據庫頁面的緩存，對InnoDB的任何修改操作都會首先在bp的page上進行，對數據庫的修改首先將記錄在flush-list上，後續由專門的線程將這些頁面寫入磁盤(disk or ssd)。這樣的好處是避免每次寫操作都操作磁盤導致大量的隨機IO，階段性的寫入還可以將多次對頁面的修改merge成一次IO操作，同時異步的寫入也降低了訪問的延遲。但是在dirty page還未刷入磁盤，server非正常關閉，那麼這些操作和數據將丟失，甚至損壞數據庫。爲了避免上述問題的產生，設計師們將這些修改先寫入一個專門的文件redo log，並在數據庫啓動時從此文件redo log 進行恢復操作，原地滿血復活，這個文件就是Redo log，從而提升了數據庫的吞吐，有效降低了訪問延時及保證了crash-safe能力。

Redo log優點	(1) 提高系統的吞吐量：組提交； (2) 降低訪問延時：順序寫日誌後磁盤； (3)崩潰恢復： crash-safe能力；
Redo log缺點	(1) 額外的寫redo log操作的開銷；  (2) 數據庫啓動時恢復操作所需要的時間；

一個 update sql 的執行流程？

瞭解了上面的一些概念和優缺點後，我們先來看一下更新sql語句的執行過程：

Update  USER_TABLE set age = age +1 where id = 6;

1、客戶端通過tcp/ip和數據庫的連接器建立連接，連接器獲取用戶賬號信息並驗證權限是否匹配；
⚠️此步可能出現的常見錯誤：“Access deied for user”
2、如果開啓了緩存查詢，先查看緩存是否存在數據，對錶的權限進行校驗，通過則直接返回給客戶端；如果沒有開啓緩存，則走向第三步；
3、通過分析器的詞法分析，得到是一個update操作，表名是USER_TABLE，字段age where；
⚠️此步可能出現的常見錯誤：“Unknown column ‘XXX’ in ‘where clause”
4、通過分析器的語義分析，看看是否有語法問題
⚠️此步可能出現的錯誤：“You hava an error in your SQL syntax. ”
5、通過優化器選擇索引，id爲主鍵，使用主鍵索引查詢；
6、將生成的最優執行方案交給執行器，執行器調用底層的存儲引擎的讀接口通過搜索書取到id=6這行的數據，如果id=6的這行數據本來就在內存中，那麼將會直接返回給執行器；否則，需要先從磁盤讀入內存，然後再返回；
7、執行器拿到引擎返回的age數據，進行運算+1，得到新的一行數據，然後執行器調用引擎的寫接口寫入這行新數據；
8、引擎將這行數據更新到內存中，同時將這個更新操作記錄到Redo log 裏面，此時redo log處於prepare狀態，然後告訴執行器完成了，隨時可以提交事務；
9、server層的執行器生成這個操作的binlog，並把binlog寫入磁盤；
10、執行器調用引擎的條事務接口，引擎把剛剛寫入的Redo log改爲提交commit狀態，更新完成。

其中8-9-10三步中將Redo log拆成兩步就是兩階段提交：主要爲了保證binlog和Redo logd的數據的邏輯一致性。

思考解惑

問題一：響應一次update sql需要寫幾次磁盤？
答：三次。redo log 2次(prepare + commit)，binlog一次。

問題二：爲什麼需要兩份日誌呢？
答：Mysql裏並沒有InnoDB引擎，MySql自帶的引擎是MyISAM，但是MyISAM 沒有crash-safe能力，binlog只能用魚歸檔，所以InnoDB使用了另外一套日誌系統，也就是Redo log來實現creash-safe的能力。
一句話區別：crash-safe是崩潰恢復，就是原地滿血復活；binlog時製造一個副本；

問題三：如何讓數據庫恢復到一個月內的任意一秒的狀態呢？
答：首先我們的備份系統需要保存近一個月的所有的binlog；另外，要求系統會定期做整庫備份，根據系統的重要性，可以一天或者是一週備份。定期的整庫備份時間越短，“最快恢復的時間”就越短，主要根據具體的業務容忍度來做。
恢復步驟：
1、找到需要恢復時間點之前的最近一次的整庫備份，將其恢復到臨時數據庫；
2、從整庫備份時間點開始，將備份的binlog依次回放，重放到需要的時間點那個時刻；
3、至於誤刪之後的，不能只靠binlog，需要和業務方一起來完成數據的恢復，因爲由於誤刪，可以插入了一些錯誤的操作；

問題四：爲什麼需要兩階段提交？
答：
1、redo log 處於prepare狀態；
2、server寫binglog；
3、redolog commit；
第2步崩潰：不滿足binlog和redo log一致性，重啓恢復：沒有commit，回滾；備份恢復：沒有binlog ；結果：一致；
第3步崩潰：滿足binlog和redo log一致性，重啓恢復：自動commit，提交；備份恢復：有binlog；結果：一致
事務是否提交的條件是：看結果是否符合我們要達到的“用binlog恢復的庫和原庫邏輯相同”這個要求；
如果不使用兩階段提交，無論是先寫Redo log 後寫 binlog，還是先寫Binlog 後寫 Redo log，都會出現主從數據庫數據的不一致性。可利用反證法證明；

問題五：兩個參數的意義？
答：innodb_flush_log_at_trx_commit：表示每次事務的redo log 都直接持久化到磁盤，值建議設置爲1，可以保證MySql異常重啓後的數據不會丟失；
sync_binlog: 表示每次事務的binlog都持久化到磁盤，這個參數最好也設置爲1，可以保證mysql異常重啓後binlog不丟失；
保證事務成功，參數設置爲1後，日誌必須落盤，這樣在crash後不會出現數據的丟失；

問題六：有了Redo log，binlog能不能去掉？
答：不能去，至少目前不能去。
原因：
1、redo log只有innodb有，別的引擎沒有；
2、redo log是循環寫的，不持久保存，binlog的歸檔功能redo log不具備。所以在主從備份的時候還是需要server層所有引擎都可以用的binlog。
3、binglog沒有crash-safe功能；
4、binlog是可以手動關閉的，所以只依靠binlog是不靠譜的；
ps：個人觀點：當redo log可以追加寫並被所有的存儲引擎可用的時候就可以丟棄binlog，並且redo log的恢復效率和同步效率會顯著提高，因爲它記錄的是物理的變化。

問題七：redo log也是寫io，如何做到優化呢？
答：主要優化有兩點：順序寫 + 組提交；
首先數據庫的數據更新都是基於內存頁的更新，更新的時候不會直接更新磁盤，如果內存有數據就直接更新內存，如果沒有就從磁盤讀取數據到內存，在內存更新，並寫入redo log。目的就是爲了減少訪問延遲，提高更新效率，等空閒的時候再將redo log所做的改變更新到磁盤中。Rodo log是順序寫，而update是直接更新磁盤，尋找到數據再進行更新；即使有索引也是隨機寫，所以速度會很慢；磁盤訪問順序寫的時間優勢，不用找“磁盤位置”。
訪問磁盤的時間：每次訪問磁盤的一個塊時，磁臂就需移動到正確的磁道上（這段時間爲尋址時間），然後盤片就需旋轉到正確的扇區上（這叫旋轉時延），這套動作需要時間，所以說順序寫比隨機寫性能高，要知道db的最大瓶頸在io；

問題八：數據庫Redo log只有commit的時候纔會真正的提交嗎？
答：正常情況是只有在commit時才提交到數據庫落盤，但是當崩潰恢復的過程中，當存在“binlog完整 + redo log prpare ”的條件，數據也會自動被提交到數據庫；redo log 和binlog 之間通過事務ID進行對應。

問題九：數據寫在redo log上而沒有寫入數據庫，那讀到的數據不是不一致嗎？
答：寫到了內存，讀取的時候是在內存讀取。並且讀和寫操作會引起內存的淘汰。

問題10：mysql啓動，對於innodb的啓動是如何實現的，undo log的作用？
答：mysql重啓，需要讀完redo log的日誌，從checkpoint開始到writepos結束。如果mysql的一個實例崩潰了，一個事務寫入了redo log但是未寫入binlog，也就是未提交commit，那麼該mysql在重啓的時候，會先恢復redo log，之後構造undo log回滾宕機前沒有提交的事務。

binlog文件

查看命令：

show binlog events mysql-bin.000001;

             *************************** 20. row ***************************
                Log_name: mysql-bin.000001  ----------------------------------------------> 查詢的binlog日誌文件名
                     Pos: 11197 ----------------------------------------------------------> pos起始點:
              Event_type: Query ----------------------------------------------------------> 事件類型：Query
               Server_id: 1 --------------------------------------------------------------> 標識是由哪臺服務器執行的
             End_log_pos: 11308 ----------------------------------------------------------> pos結束點:11308(即：下行的pos起始點)
                    Info: use `zyyshop`; INSERT INTO `team2` VALUES (0,345,'asdf8er5') ---> 執行的sql語句
             *************************** 21. row ***************************
                Log_name: mysql-bin.000001
                     Pos: 11308 ----------------------------------------------------------> pos起始點:11308(即：上行的pos結束點)
              Event_type: Query
               Server_id: 1
             End_log_pos: 11417
                    Info: use `zyyshop`; /*!40000 ALTER TABLE `team2` ENABLE KEYS */
             *************************** 22. row ***************************
                Log_name: mysql-bin.000001
                     Pos: 11417
              Event_type: Query
               Server_id: 1
             End_log_pos: 11510
                    Info: use `zyyshop`; DROP TABLE IF EXISTS `type`

學習筆記，內容簡單，用於複習，原內容2月有更新。
##參考資料，《MySql實戰詳解》

戎·馬一生

發佈了250 篇原創文章 · 獲贊 191 · 訪問量 57萬+

他的留言板關注

一條更新sql的執行之路

Redolog與binlog

一個 update sql 的執行流程？

思考解惑

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

nodejs學習06——小案例

評估統計算法在銀行僞造鈔票檢測中的價值

C# Xmlserializer 程序集內存泄露

Java ThreadPoolShutdown

5月21日相聚上海張江！與文心大模型一起共建大模型產業應用生態圈

《劍指offer》:[55]字符流中第一個不重複的字符

《劍指offer》:[52]構建乘積數組

一條更新sql的執行之路

《劍指offer》:[56]五岔路口交通管理紅綠燈設計

數據庫事務隔離

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結