- Posted by 微博@Yangsc_o
- 原創文章,版權聲明:自由轉載-非商用-非衍生-保持署名 | Creative Commons BY-NC-ND 3.0
鎖概述
鎖是計算機協調多個進程或線程併發訪問某一資源的機制(避免爭搶)。
在數據庫中,除傳統的計算資源(如 CPU、RAM、I/O 等)的爭用以外,數據也是一種供許多用戶共享的資源。如
何保證數據併發訪問的一致性、有效性是所有數據庫必須解決的一個問題,鎖衝突也是影響數據庫併發訪問性能的
一個重要因素。從這個角度來說,鎖對數據庫而言顯得尤其重要,也更加複雜
鎖分類
- 從對數據操作的粒度分
1) 表鎖:操作時,會鎖定整個表。
2) 行鎖:操作時,會鎖定當前操作行。
- 從對數據操作的類型分
1) 讀鎖(共享鎖):針對同一份數據,多個讀操作可以同時進行而不會互相影響
2) 寫鎖(排它鎖):當前操作沒有完成之前,它會阻斷其他寫鎖和讀鎖
- Mysql 鎖
相對其他數據庫而言,MySQL的鎖機制比較簡單,其最顯著的特點是不同的存儲引擎支持不同的鎖機制。下表中羅
列出了各存儲引擎對鎖的支持情況:
-
MySQL這3種鎖的特性可大致歸納如下 :
- 表鎖
偏向MyISAM 存儲引擎,開銷小,加鎖快;不會出現死鎖;鎖定粒度大,發生鎖衝突的概率最高,併發度最低。
- 行鎖
偏向InnoDB 存儲引擎,開銷大,加鎖慢;會出現死鎖;鎖定粒度最小,發生鎖衝突的概率最低,併發度也最高。
- 頁面鎖
開銷和加鎖時間界於表鎖和行鎖之間;會出現死鎖;鎖定粒度界於表鎖和行鎖之間,併發度一般
MyISAM 表鎖
- 對MyISAM 表的讀操作,不會阻塞其他用戶對同一表的讀請求,但會阻塞對同一表的寫請求;
- 對MyISAM 表的寫操作,則會阻塞其他用戶對同一表的讀和寫操作;
簡而言之,就是讀鎖會阻塞寫,但是不會阻塞讀。而寫鎖,則既會阻塞讀,又會阻塞寫。
- 此外,MyISAM 的讀寫鎖調度是寫優先,這也是MyISAM不適合做寫爲主的表的存儲引擎的原因。因爲寫鎖後,其他線程不能做任何操作,大量的更新會使查詢很難得到鎖,從而造成永遠阻塞。
InnoDB 行鎖
- 行鎖特點 :偏向InnoDB 存儲引擎,開銷大,加鎖慢;會出現死鎖;鎖定粒度最小,發生鎖衝突的概率最低,併發度也最高。
- InnoDB 與 MyISAM 的最大不同有兩點:一是支持事務;二是 採用了行級鎖。
事務及其ACID屬性
- 事務是由一組SQL語句組成的邏輯處理單元,事務具有以下4個特性,簡稱爲事務ACID屬性。
- 併發事務處理帶來的問題
- 事務隔離級別
- 爲了解決上述提到的事務併發問題,數據庫提供一定的事務隔離機制來解決這個問題。數據庫的事務隔離越嚴格,併發副作用越小,但付出的代價也就越大,因爲事務隔離實質上就是使用事務在一定程度上“串行化” 進行,這顯然
與“併發” 是矛盾的。 - 數據庫的隔離級別有4個,由低到高依次爲Read uncommitted、Read committed、Repeatable read、
Serializable,這四個級別可以逐個解決髒寫、髒讀、不可重複讀、幻讀這幾類問題。
Mysql 的數據庫的默認隔離級別爲 Repeatable read;
- 爲了解決上述提到的事務併發問題,數據庫提供一定的事務隔離機制來解決這個問題。數據庫的事務隔離越嚴格,併發副作用越小,但付出的代價也就越大,因爲事務隔離實質上就是使用事務在一定程度上“串行化” 進行,這顯然
InnoDB 的行鎖模式
InnoDB 實現了以下兩種類型的行鎖。
- 共享鎖(S):又稱爲讀鎖,簡稱S鎖,共享鎖就是多個事務對於同一數據可以共享一把鎖,都能訪問到數據,但是隻能讀不能修改。
- 排他鎖(X):又稱爲寫鎖,簡稱X鎖,排他鎖就是不能與其他鎖並存,如一個事務獲取了一個數據行的排他鎖,其他事務就不能再獲取該行的其他鎖,包括共享鎖和排他鎖,但是獲取排他鎖的事務是可以對數據就行讀取和修改。
對於UPDATE、DELETE和INSERT語句,InnoDB會自動給涉及數據集加排他鎖(X);對於普通SELECT語句,InnoDB不會加任何鎖;
- 無索引行鎖升級爲表鎖
如果不通過索引條件檢索數據,那麼InnoDB將對錶中的所有記錄加鎖,實際效果跟表鎖一樣。
- 間隙鎖危害
當我們用範圍條件,而不是使用相等條件檢索數據,並請求共享或排他鎖時,InnoDB會給符合條件的已有數據進行加鎖; 對於鍵值在條件範圍內但並不存在的記錄,叫做 “間隙(GAP)” ,InnoDB也會對這個 “間隙” 加鎖,這種鎖機制就是所謂的間隙鎖(Next-Key鎖)
注意
-
InnoDB存儲引擎由於實現了行級鎖定,雖然在鎖定機制的實現方面帶來了性能損耗可能比表鎖會更高一些,但是在整體併發處理能力方面要遠遠由於MyISAM的表鎖的。當系統併發量較高的時候,InnoDB的整體性能和MyISAM相比就會有比較明顯的優勢。
-
但是,InnoDB的行級鎖同樣也有其脆弱的一面,當我們使用不當的時候,可能會讓InnoDB的整體性能表現不僅不
能比MyISAM高,甚至可能會更差。
- 儘可能讓所有數據檢索都能通過索引來完成,避免無索引行鎖升級爲表鎖。
- 合理設計索引,儘量縮小鎖的範圍
- 儘可能減少索引條件,及索引範圍,避免間隙鎖
- 儘量控制事務大小,減少鎖定資源量和時間長度
- 儘可使用低級別事務隔離(但是需要業務層面滿足需求)
MVCC
MVCC (Multiversion Concurrency Control) 中文全程叫多版本併發控制,是現代數據庫(包括 MySQL、Oracle、PostgreSQL 等)引擎實現中常用的處理讀寫衝突的手段,目的在於提高數據庫高併發場景下的吞吐性能。
- 如此一來不同的事務在併發過程中,SELECT 操作可以不加鎖而是通過 MVCC 機制讀取指定的版本歷史記錄,並通過一些手段保證保證讀取的記錄值符合事務所處的隔離級別,從而解決併發場景下的讀寫衝突。
InnoDB 中的 MVCC
- InnoDB MVCC 實現原理的關鍵
1、事務版本號
2、表的隱藏列。
3、undo log
4、 read view
InnoDB 中 MVCC 的實現方式爲:每一行記錄都有兩個隱藏列:DATA_TRX_ID、DATA_ROLL_PTR(如果沒有主鍵,則還會多一個隱藏的主鍵列)。
- DATA_TRX_ID
記錄最近更新這條行記錄的事務 ID,大小爲 6 個字節
- DATA_ROLL_PTR
表示指向該行回滾段(rollback segment)的指針,大小爲 7 個字節,InnoDB 便是通過這個指針找到之前版本的數據。該行記錄上所有舊版本,在 undo 中都通過鏈表的形式組織。
- DB_ROW_ID
行標識(隱藏單調自增 ID),大小爲 6 字節,如果表沒有主鍵,InnoDB 會自動生成一個隱藏主鍵,因此會出現這個列。另外,每條記錄的頭信息(record header)裏都有一個專門的 bit(deleted_flag)來表示當前記錄是否已經被刪除。
- 組織 Undo Log 鏈
- 如何實現一致性讀 —— ReadView
InnoDB 爲了解決這個問題,設計了 ReadView(可讀視圖)的概念。
ReadView :每個 SELECT 語句開始時,會生成一致性視圖,ReadView 中是當前活躍的事務 ID 列表,稱之爲 m_ids,其中最小值爲 up_limit_id,最大值爲low_limit_id,事務 ID 是事務開啓時 InnoDB 分配的,其大小決定了事務開啓的先後順序,因此我們可以通過 ID 的大小關係來決定版本記錄的可見性;
- 如果被訪問版本的 trx_id 小於 m_ids 中的最小值 up_limit_id,說明生成該版本的事務在 ReadView 生成前就已經提交了,所以該版本可以被當前事務訪問。
- 如果被訪問版本的 trx_id 大於 m_ids 列表中的最大值 low_limit_id,說明生成該版本的事務在生成 ReadView 後才生成,所以該版本不可以被當前事務訪問。需要根據 Undo Log 鏈找到前一個版本,然後根據該版本的 DB_TRX_ID 重新判斷可見性。
- 如果被訪問版本的 trx_id 屬性值在 m_ids 列表中最大值和最小值之間(包含),那就需要判斷一下 trx_id 的值是不是在 m_ids 列表中。如果在,說明創建 ReadView 時生成該版本所屬事務還是活躍的,因此該版本不可以被訪問,需要查找 Undo Log 鏈得到上一個版本,然後根據該版本的 DB_TRX_ID 再從頭計算一次可見性;如果不在,說明創建 ReadView 時生成該版本的事務已經被提交,該版本可以被訪問。
- 此時經過一系列判斷我們已經得到了這條記錄相對 ReadView 來說的可見結果。此時,如果這條記錄的 delete_flag 爲 true,說明這條記錄已被刪除,不返回。否則說明此記錄可以安全返回給客戶端。