面試官:什麼是MySQL 事務與 MVCC 原理?

作者:小林coding

圖解計算機基礎網站https://xiaolincoding.com/

大家好,我是小林。

之前寫過一篇 MySQL 的 MVCC 的工作原理,最近有讀者在網站上學習的時候,評論區指出了一些問題。

而這個知識點很重要,面試太常問了,所以,我就重寫了這篇文章!開車!

正文

這是我的錢包,共有 100 萬元。

今天我心情好,我決定給你的轉賬 100 萬,最後的結果肯定是我的餘額變爲 0 元,你的餘額多了 100 萬元,是不是想到就很開心?

轉賬這一動作在程序裏會涉及到一系列的操作,假設我向你轉賬 100 萬的過程是有下面這幾個步驟組成的:

可以看到這個轉賬的過程涉及到了兩次修改數據庫的操作。

假設在執行第三步驟之後,服務器忽然掉電了,就會發生一個蛋疼的事情,我的賬戶扣了 100 萬,但是錢並沒有到你的賬戶上,也就是說這 100 萬消失了!

要解決這個問題,就要保證轉賬業務裏的所有數據庫的操作是不可分割的,要麼全部執行成功 ,要麼全部失敗,不允許出現中間狀態的數據。

數據庫中的「事務(Transaction」就能達到這樣的效果。

我們在轉賬操作前先開啓事務,等所有數據庫操作執行完成後,才提交事務,對於已經提交的事務來說,該事務對數據庫所做的修改將永久生效,如果中途發生發生中斷或錯誤,那麼該事務期間對數據庫所做的修改將會被回滾到沒執行該事務之前的狀態。


事務有哪些特性?

事務是由 MySQL 的引擎來實現的,我們常見的 InnoDB 引擎它是支持事務的。

不過並不是所有的引擎都能支持事務,比如 MySQL 原生的 MyISAM 引擎就不支持事務,也正是這樣,所以大多數 MySQL 的引擎都是用 InnoDB。

事務看起來感覺簡單,但是要實現事務必須要遵守 4 個特性,分別如下:

  • 原子性(Atomicity):一個事務中的所有操作,要麼全部完成,要麼全部不完成,不會結束在中間某個環節,而且事務在執行過程中發生錯誤,會被回滾到事務開始前的狀態,就像這個事務從來沒有執行過一樣;
  • 一致性(Consistency):數據庫的完整性不會因爲事務的執行而受到破壞,比如表中有一個字段爲姓名,它有唯一約束,也就是表中姓名不能重複,如果一個事務對姓名字段進行了修改,但是在事務提交後,表中的姓名變得非唯一性了,這就破壞了事務的一致性要求,這時數據庫就要撤銷該事務,返回初始化的狀態。
  • 隔離性(Isolation):數據庫允許多個併發事務同時對其數據進行讀寫和修改的能力,隔離性可以防止多個事務併發執行時由於交叉執行而導致數據的不一致。
  • 持久性(Durability):事務處理結束後,對數據的修改就是永久的,即便系統故障也不會丟失。

InnoDB 引擎通過什麼技術來保證事務的這四個特性的呢?

  • 持久性是通過 redo log (重做日誌)來保證的;
  • 原子性是通過 undo log(回滾日誌) 來保證的;
  • 隔離性是通過 MVCC(多版本併發控制) 或鎖機制來保證的;
  • 一致性則是通過持久性+原子性+隔離性來保證;

這次將重點介紹事務的隔離性,這也是面試時最常問的知識的點。

爲什麼事務要有隔離性,我們就要知道併發事務時會引發什麼問題。

並行事務會引發什麼問題?

MySQL 服務端是允許多個客戶端連接的,這意味着 MySQL 會出現同時處理多個事務的情況。

那麼在同時處理多個事務的時候,就可能出現髒讀(dirty read)、不可重複讀(non-repeatable read)、幻讀(phantom read)的問題

接下來,通過舉例子給大家說明,這些問題是如何發生的。

髒讀

如果一個事務「讀到」了另一個「未提交事務修改過的數據」,就意味着發生了「髒讀」現象。

舉個栗子。

假設有 A 和 B 這兩個事務同時在處理,事務 A 先開始從數據庫中讀取小林的餘額數據,然後再執行更新操作,如果此時事務 A 還沒有提交事務,而此時正好事務 B 也從數據庫中讀取小林的餘額數據,那麼事務 B 讀取到的餘額數據是剛纔事務 A 更新後的數據,即使沒有提交事務。

因爲事務 A 是還沒提交事務的,也就是它隨時可能發生回滾操作,如果在上面這種情況事務 A 發生了回滾,那麼事務 B 剛纔得到的數據就是過期的數據,這種現象就被稱爲髒讀。

不可重複讀

在一個事務內多次讀取同一個數據,如果出現前後兩次讀到的數據不一樣的情況,就意味着發生了「不可重複讀」現象。

舉個栗子。

假設有 A 和 B 這兩個事務同時在處理,事務 A 先開始從數據庫中讀取小林的餘額數據,然後繼續執行代碼邏輯處理,在這過程中如果事務 B 更新了這條數據,並提交了事務,那麼當事務 A 再次讀取該數據時,就會發現前後兩次讀到的數據是不一致的,這種現象就被稱爲不可重複讀。

幻讀

在一個事務內多次查詢某個符合查詢條件的「記錄數量」,如果出現前後兩次查詢到的記錄數量不一樣的情況,就意味着發生了「幻讀」現象。

舉個栗子。

假設有 A 和 B 這兩個事務同時在處理,事務 A 先開始從數據庫查詢賬戶餘額大於 100 萬的記錄,發現共有 5 條,然後事務 B 也按相同的搜索條件也是查詢出了 5 條記錄。

接下來,事務 A 插入了一條餘額超過 100 萬的賬號,並提交了事務,此時數據庫超過 100 萬餘額的賬號個數就變爲 6。

然後事務 B 再次查詢賬戶餘額大於 100 萬的記錄,此時查詢到的記錄數量有 6 條,發現和前一次讀到的記錄數量不一樣了,就感覺發生了幻覺一樣,這種現象就被稱爲幻讀。

事務的隔離級別有哪些?

前面我們提到,當多個事務併發執行時可能會遇到「髒讀、不可重複讀、幻讀」的現象,這些現象會對事務的一致性產生不同程序的影響。

  • 髒讀:讀到其他事務未提交的數據;
  • 不可重複讀:前後讀取的數據不一致;
  • 幻讀:前後讀取的記錄數量不一致。

這三個現象的嚴重性排序如下:

SQL 標準提出了四種隔離級別來規避這些現象,隔離級別越高,性能效率就越低,這四個隔離級別如下:

  • 讀未提交(read uncommitted,指一個事務還沒提交時,它做的變更就能被其他事務看到;
  • 讀提交(read committed,指一個事務提交之後,它做的變更才能被其他事務看到;
  • 可重複讀(repeatable read,指一個事務執行過程中看到的數據,一直跟這個事務啓動時看到的數據是一致的,MySQL InnoDB 引擎的默認隔離級別
  • 串行化(serializable;會對記錄加上讀寫鎖,在多個事務對這條記錄進行讀寫操作時,如果發生了讀寫衝突的時候,後訪問的事務必須等前一個事務執行完成,才能繼續執行;

按隔離水平高低排序如下:

針對不同的隔離級別,併發事務時可能發生的現象也會不同。

也就是說:

  • 在「讀未提交」隔離級別下,可能發生髒讀、不可重複讀和幻讀現象;
  • 在「讀提交」隔離級別下,可能發生不可重複讀和幻讀現象,但是不可能發生髒讀現象;
  • 在「可重複讀」隔離級別下,可能發生幻讀現象,但是不可能髒讀和不可重複讀現象;
  • 在「串行化」隔離級別下,髒讀、不可重複讀和幻讀現象都不可能會發生。

所以,要解決髒讀現象,就要升級到「讀提交」以上的隔離級別;要解決不可重複讀現象,就要升級到「可重複讀」的隔離級別

不過,要解決幻讀現象不建議將隔離級別升級到「串行化」,因爲這樣會導致數據庫在併發事務時性能很差。

InnoDB 引擎的默認隔離級別雖然是「可重複讀」,但是它通過next-key lock 鎖(行鎖和間隙鎖的組合)來鎖住記錄之間的“間隙”和記錄本身,防止其他事務在這個記錄之間插入新的記錄,這樣就避免了幻讀現象。

接下里,舉個具體的例子來說明這四種隔離級別,有一張賬戶餘額表,裏面有一條記錄:

然後有兩個併發的事務,事務 A 只負責查詢餘額,事務 B 則會將我的餘額改成 200 萬,下面是按照時間順序執行兩個事務的行爲:

在不同隔離級別下,事務 A 執行過程中查詢到的餘額可能會不同:

  • 在「讀未提交」隔離級別下,事務 B 修改餘額後,雖然沒有提交事務,但是此時的餘額已經可以被事務 A 看見了,於是事務 A 中餘額 V1 查詢的值是 200 萬,餘額 V2、V3 自然也是 200 萬了;
  • 在「讀提交」隔離級別下,事務 B 修改餘額後,因爲沒有提交事務,所以事務 A 中餘額 V1 的值還是 100 萬,等事務 B 提交完後,最新的餘額數據才能被事務 A 看見,因此額 V2、V3 都是 200 萬;
  • 在「可重複讀」隔離級別下,事務 A 只能看見啓動事務時的數據,所以餘額 V1、餘額 V2 的值都是 100 萬,當事務 A 提交事務後,就能看見最新的餘額數據了,所以餘額 V3 的值是 200 萬;
  • 在「串行化」隔離級別下,事務 B 在執行將餘額 100 萬修改爲 200 萬時,由於此前事務 A 執行了讀操作,這樣就發生了讀寫衝突,於是就會被鎖住,直到事務 A 提交後,事務 B 纔可以繼續執行,所以從 A 的角度看,餘額 V1、V2 的值是 100 萬,餘額 V3 的值是 200萬。

這四種隔離級別具體是如何實現的呢?

  • 對於「讀未提交」隔離級別的事務來說,因爲可以讀到未提交事務修改的數據,所以直接讀取最新的數據就好了;
  • 對於「串行化」隔離級別的事務來說,通過加讀寫鎖的方式來避免並行訪問;
  • 對於「讀提交」和「可重複讀」隔離級別的事務來說,它們是通過 Read View 來實現的,它們的區別在於創建 Read View 的時機不同,大家可以把 Read View 理解成一個數據快照,就像相機拍照那樣,定格某一時刻的風景。「讀提交」隔離級別是在「每個語句執行前」都會重新生成一個 Read View,而「可重複讀」隔離級別是「啓動事務時」生成一個 Read View,然後整個事務期間都在用這個 Read View

注意,執行「開始事務」命令,並不意味着啓動了事務。在 MySQL 有兩種開啓事務的命令,分別是:

  • 第一種:begin/start transaction 命令;
  • 第二種:start transaction with consistent snapshot 命令;

這兩種開啓事務的命令,事務的啓動時機是不同的:

  • 執行了 begin/start transaction 命令後,並不代表事務啓動了。只有在執行這個命令後,執行了增刪查改操作的 SQL 語句,纔是事務真正啓動的時機;
  • 執行了 start transaction with consistent snapshot 命令,就會馬上啓動事務。

接下來詳細說下,Read View 在 MVCC 裏如何工作的?

Read View 在 MVCC 裏如何工作的?

我們需要了解兩個知識:

  • Read View 中四個字段作用;
  • 聚簇索引記錄中兩個跟事務有關的隱藏列;

那 Read View 到底是個什麼東西?

Read View 有四個重要的字段:

  • m_ids :指的是在創建 Read View 時,當前數據庫中「活躍事務」的事務 id 列表,注意是一個列表,“活躍事務”指的就是,啓動了但還沒提交的事務
  • min_trx_id :指的是在創建 Read View 時,當前數據庫中「活躍事務」中事務 id 最小的事務,也就是 m_ids 的最小值。
  • max_trx_id :這個並不是 m_ids 的最大值,而是創建 Read View 時當前數據庫中應該給下一個事務的 id 值,也就是全局最大的事務 id + 1。
  • creator_trx_id :指的是創建該 Read View 的事務的事務 id

知道了 Read View 的字段,我們還需要了解聚簇索引記錄中的兩個隱藏列。

假設在賬戶餘額表插入一條小林餘額爲 100 萬的記錄,然後我把這兩個隱藏列也畫出來,該記錄的整個示意圖如下:

對於使用 InnoDB 存儲引擎的數據庫表,它的聚簇索引記錄中都包含下面兩個隱藏列:

  • trx_id,當一個事務對某條聚簇索引記錄進行改動時,就會把該事務的事務 id 記錄在 trx_id 隱藏列裏
  • roll_pointer,每次對某條聚簇索引記錄進行改動時,都會把舊版本的記錄寫入到 undo 日誌中,然後這個隱藏列是個指針,指向每一箇舊版本記錄,於是就可以通過它找到修改前的記錄。

在創建 Read View 後,我們可以將記錄中的 trx_id 劃分這三種情況:

一個事務去訪問記錄的時候,除了自己的更新記錄總是可見之外,還有這幾種情況:

  • 如果記錄的 trx_id 值小於 Read View 中的 min_trx_id 值,表示這個版本的記錄是在創建 Read View 已經提交的事務生成的,所以該版本的記錄對當前事務可見
  • 如果記錄的 trx_id 值大於等於 Read View 中的 max_trx_id 值,表示這個版本的記錄是在創建 Read View 才啓動的事務生成的,所以該版本的記錄對當前事務不可見
  • 如果記錄的 trx_id 值在 Read View 的 min_trx_idmax_trx_id 之間,需要判斷 trx_id 是否在 m_ids 列表中:
    • 如果記錄的 trx_id m_ids 列表中,表示生成該版本記錄的活躍事務依然活躍着(還沒提交事務),所以該版本的記錄對當前事務不可見
    • 如果記錄的 trx_id 不在 m_ids 列表中,表示生成該版本記錄的活躍事務已經被提交,所以該版本的記錄對當前事務可見

這種通過「版本鏈」來控制併發事務訪問同一個記錄時的行爲就叫 MVCC(多版本併發控制)。

可重複讀是如何工作的?

可重複讀隔離級別是啓動事務時生成一個 Read View,然後整個事務期間都在用這個 Read View

假設事務 A (事務 id 爲51)啓動後,緊接着事務 B (事務 id 爲52)也啓動了,那這兩個事務創建的 Read View 如下:

事務 A 和 事務 B 的 Read View 具體內容如下:

  • 在事務 A 的 Read View 中,它的事務 id 是 51,由於它是第一個啓動的事務,所以此時活躍事務的事務 id 列表就只有 51,活躍事務的事務 id 列表中最小的事務 id 是事務 A 本身,下一個事務 id 則是 52。
  • 在事務 B 的 Read View 中,它的事務 id 是 52,由於事務 A 是活躍的,所以此時活躍事務的事務 id 列表是 51 和 52,活躍的事務 id 中最小的事務 id 是事務 A,下一個事務 id 應該是 53。

接着,在可重複讀隔離級別下,事務 A 和事務 B 按順序執行了以下操作:

  • 事務 B 讀取小林的賬戶餘額記錄,讀到餘額是 100 萬;
  • 事務 A 將小林的賬戶餘額記錄修改成 200 萬,並沒有提交事務;
  • 事務 B 讀取小林的賬戶餘額記錄,讀到餘額還是 100 萬;
  • 事務 A 提交事務;
  • 事務 B 讀取小林的賬戶餘額記錄,讀到餘額依然還是 100 萬;

接下來,跟大傢俱體分析下。

事務 B 第一次讀小林的賬戶餘額記錄,在找到記錄後,它會先看這條記錄的 trx_id,此時發現 trx_id 爲 50,比事務 B 的 Read View 中的 min_trx_id 值(51)還小,這意味着修改這條記錄的事務早就在事務 B 啓動前提交過了,所以該版本的記錄對事務 B 可見的,也就是事務 B 可以獲取到這條記錄。

接着,事務 A 通過 update 語句將這條記錄修改了(還未提交事務),將小林的餘額改成 200 萬,這時 MySQL 會記錄相應的 undo log,並以鏈表的方式串聯起來,形成版本鏈,如下圖:

你可以在上圖的「記錄的字段」看到,由於事務 A 修改了該記錄,以前的記錄就變成舊版本記錄了,於是最新記錄和舊版本記錄通過鏈表的方式串起來,而且最新記錄的 trx_id 是事務 A 的事務 id(trx_id = 51)。

然後事務 B 第二次去讀取該記錄,發現這條記錄的 trx_id 值爲 51,在事務 B 的 Read View 的 min_trx_id 和 max_trx_id 之間,則需要判斷 trx_id 值是否在 m_ids 範圍內,判斷的結果是在的,那麼說明這條記錄是被還未提交的事務修改的,這時事務 B 並不會讀取這個版本的記錄。而是沿着 undo log 鏈條往下找舊版本的記錄,直到找到 trx_id 「小於」事務 B 的 Read View 中的 min_trx_id 值的第一條記錄,所以事務 B 能讀取到的是 trx_id 爲 50 的記錄,也就是小林餘額是 100 萬的這條記錄。

最後,當事物 A 提交事務後,由於隔離級別時「可重複讀」,所以事務 B 再次讀區記錄時,還是基於啓動事務時創建的 Read View 來判斷當前版本的記錄是否可見。所以,即使事物 A 將小林餘額修改爲 200 萬並提交了事務, 事務 B 第三次讀取記錄時,讀到的記錄都是小林餘額是 100 萬的這條記錄

就是通過這樣的方式實現了,「可重複讀」隔離級別下在事務期間讀到的記錄都是事務啓動前的記錄。

讀提交是如何工作的?

讀提交隔離級別是在每次讀取數據時,都會生成一個新的 Read View

也意味着,事務期間的多次讀取同一條數據,前後兩次讀的數據可能會出現不一致,因爲可能這期間另外一個事務修改了該記錄,並提交了事務。

那讀提交隔離級別是怎麼工作呢?我們還是以前面的例子來聊聊。

假設事務 A (事務 id 爲51)啓動後,緊接着事務 B (事務 id 爲52)也啓動了,接着按順序執行了以下操作:

  • 事務 B 讀取數據(創建 Read View),小林的賬戶餘額爲 100 萬;
  • 事務 A 修改數據(還沒提交事務),將小林的賬戶餘額從 100 萬修改成了 200 萬;
  • 事務 B 讀取數據(創建 Read View),小林的賬戶餘額爲 100 萬;
  • 事務 A 提交事務;
  • 事務 B 讀取數據(創建 Read View),小林的賬戶餘額爲 200 萬;

那具體怎麼做到的呢?我們重點看事務 B 每次讀取數據時創建的 Read View。前兩次 事務 B 讀取數據時創建的 Read View 如下圖:

我們來分析下爲什麼事務 B 第二次讀數據時,讀不到事務 A (還未提交事務)修改的數據?

事務 B 在找到小林這條記錄時,會看這條記錄的 trx_id 是 51,在事務 B 的 Read View 的 min_trx_id 和 max_trx_id 之間,接下來需要判斷 trx_id 值是否在 m_ids 範圍內,判斷的結果是在的,那麼說明這條記錄是被還未提交的事務修改的,這時事務 B 並不會讀取這個版本的記錄。而是,沿着 undo log 鏈條往下找舊版本的記錄,直到找到 trx_id 「小於」事務 B 的 Read View 中的 min_trx_id 值的第一條記錄,所以事務 B 能讀取到的是 trx_id 爲 50 的記錄,也就是小林餘額是 100 萬的這條記錄。

我們來分析下爲什麼事務 A 提交後,事務 B 就可以讀到事務 A 修改的數據?

在事務 A 提交後,由於隔離級別是「讀提交」,所以事務 B 在每次讀數據的時候,會重新創建 Read View,此時事務 B 第三次讀取數據時創建的 Read View 如下:

在這裏插入圖片描述在這裏插入圖片描述

事務 B 在找到小林這條記錄時,會發現這條記錄的 trx_id 是 51,比事務 B 的 Read View 中的 min_trx_id 值(52)還小,這意味着修改這條記錄的事務早就在創建 Read View 前提交過了,所以該版本的記錄對事務 B 是可見的

正是因爲在讀提交隔離級別下,事務每次讀數據時都重新創建 Read View,那麼在事務期間的多次讀取同一條數據,前後兩次讀的數據可能會出現不一致,因爲可能這期間另外一個事務修改了該記錄,並提交了事務。

總結

事務是在 MySQL 引擎層實現的,我們常見的 InnoDB 引擎是支持事務的,事務的四大特性是原子性、一致性、隔離性、持久性,我們這次主要講的是隔離性。

當多個事務併發執行的時候,會引發髒讀、不可重複讀、幻讀這些問題,那爲了避免這些問題,SQL 提出了四種隔離級別,分別是讀未提交、讀已提交、可重複讀、串行化,從左往右隔離級別順序遞增,隔離級別越高,意味着性能越差,InnoDB 引擎的默認隔離級別是可重複讀。

要解決髒讀現象,就要將隔離級別升級到讀已提交以上的隔離級別,要解決不可重複讀現象,就要將隔離級別升級到可重複讀以上的隔離級別。

而對於幻讀現象,不建議將隔離級別升級爲串行化,因爲這會導致數據庫併發時性能很差。InnoDB 引擎的默認隔離級別雖然是「可重複讀」,但是它通過 next-key lock 鎖(行鎖+間隙鎖的組合)來鎖住記錄之間的“間隙”和記錄本身,防止其他事務在這個記錄之間插入新的記錄,這樣就避免了幻讀現象。

對於「讀提交」和「可重複讀」隔離級別的事務來說,它們是通過 **Read View **來實現的,它們的區別在於創建 Read View 的時機不同:

  • 「讀提交」隔離級別是在每個 select 都會生成一個新的 Read View,也意味着,事務期間的多次讀取同一條數據,前後兩次讀的數據可能會出現不一致,因爲可能這期間另外一個事務修改了該記錄,並提交了事務。
  • 「可重複讀」隔離級別是啓動事務時生成一個 Read View,然後整個事務期間都在用這個 Read View,這樣就保證了在事務期間讀到的數據都是事務啓動前的記錄。

這兩個隔離級別實現是通過「事務的 Read View 裏的字段」和「記錄中的兩個隱藏列」的比對,來控制併發事務訪問同一個記錄時的行爲,這就叫 MVCC(多版本併發控制)。

在可重複讀隔離級別中,普通的 select 語句就是基於 MVCC 實現的快照讀,也就是不會加鎖的。而 select .. for update 語句就不是快照讀了,而是當前讀了,也就是每次讀都是拿到最新版本的數據,但是它會對讀到的記錄加上 next-key lock 鎖。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章