Table of Contents
什麼是分佈式事務?
我們看看百度上對於分佈式事務的定義:分佈式事務是指事務的參與者、支持事務的服務器、資源服務器以及事務管理器分別位於不同的分佈式系統的不同節點之上。
額~ 看了反而更懵逼了,簡單的畫個圖好讓大家理解一下,拿下單減庫存來說舉例:當系統的業務量很小時,“一站式
”的系統完全可以滿足現有業務需求,所有的業務都共用一個數據庫,整個下單流程或許只用在一個方法裏同一個事務下操作數據庫即可。
此時所有操作都在一個事務裏,要麼全部提交,要麼全部回滾 。
圖糙理不糙
但隨着業務量不斷增長,“一站式
”系統漸漸扛不住巨大的流量,就需要對數據庫進行分庫分表,將業務服務化拆分(SOA
),就會分離出了訂單中心、用戶中心、庫存中心。而這樣就造成業務間相互隔離,每個業務都維護着自己的數據庫,數據的交換隻能進行RPC調用。
用戶再下單時,創建訂單和扣減庫存,需要同時對訂單DB和庫存DB進行操作。兩步操作必須同時成功,否則就會造成業務混亂,可此時我們只能保證自己服務的數據一致性,無法保證調用其他服務的操作是否成功,所以爲了保證整個下單流程的數據一致性,就需要分佈式事務介入。
在說分佈式事務之前,先回憶一下事務的基本概念:事務是一個程序執行單元,裏面的所有操作要麼全部執行成功,要麼全部執行失敗。
一個事務有四個基本特性,也就是我們常說的(ACID
)。
Atomicity
(原子性) :事務是一個不可分割的整體,事務內所有操作要麼全做成功,要麼全失敗。
Consistency
(一致性) :務執行前後,數據從一個狀態到另一個狀態必須是一致的(A向B轉賬,不能出現A扣了錢,B卻沒收到)。
Isolation
(隔離性):多個併發事務之間相互隔離,不能互相干擾。
Durablity
(持久性) :事務完成後,對數據庫的更改是永久保存的,不能回滾。
上面這些知識點都是反反覆覆唸叨的概念,面試必背的東西。
分佈式事務解決方案
有困難就一定會有解決問題的辦法,什麼都難不倒聰明的程序員。
XA協議
是一個基於數據庫的分佈式事務協議,其分爲兩部分:事務管理器
和本地資源管理器
。
事務管理器
作爲一個全局的調度者,負責對各個本地資源管理器統一號令提交
或者回滾
。二階提交協議(
2PC
)和三階提交協議(3PC
)就是根據此協議衍生出來而來。如今
Oracle
、Mysql
等數據庫均已實現了XA接口
。
1、兩段提交(2PC)
兩段提交
顧名思義就是要進行兩個階段的提交:第一階段,準備階段(投票階段) ;第二階段,提交階段(執行階段)。
下面還拿下單扣庫存舉例子,簡單描述一下兩段提交(2PC)的原理:
之前說過業務服務化(SOA
)以後,一個下單流程就會用到多個服務,各個服務都無法保證調用的其他服務的成功與否,這個時候就需要一個全局的角色(協調者
)對各個服務(參與者
)進行協調。
一個下單請求過來通過協調者
,給每一個參與者
發送Prepare
消息,執行本地數據腳本但不提交事務。
如果協調者
收到了參與者
的失敗消息或者超時,直接給每個參與者
發送回滾(Rollback)
消息;否則,發送提交(Commit)
消息;參與者
根據協調者
的指令執行提交或者回滾操作,釋放所有事務處理過程中被佔用的資源,顯然2PC
做到了所有操作要麼全部成功、要麼全部失敗。
兩段提交(2PC)的缺點
二階段提交看似能夠提供原子性的操作,但它存在着嚴重的缺陷
-
網絡抖動導致的數據不一致: 第二階段中
協調者
向參與者
發送commit
命令之後,一旦此時發生網絡抖動,導致一部分參與者
接收到了commit
請求並執行,可其他未接到commit
請求的參與者
無法執行事務提交。進而導致整個分佈式系統出現了數據不一致。 -
超時導致的同步阻塞問題:
2PC
中的所有的參與者節點都爲事務阻塞型
,當某一個參與者
節點出現通信超時,其餘參與者
都會被動阻塞佔用資源不能釋放。 -
單點故障的風險: 由於嚴重的依賴
協調者
,一旦協調者
發生故障,而此時參與者
還都處於鎖定資源的狀態,無法完成事務commit
操作。雖然協調者出現故障後,會重新選舉一個協調者,可無法解決因前一個協調者
宕機導致的參與者
處於阻塞狀態的問題。
2、三段提交(3PC)
三段提交(3PC)是對兩段提交(2PC)的一種升級優化,3PC
在2PC
的第一階段和第二階段中插入一個準備階段。保證了在最後提交階段之前,各參與者節點的狀態都一致。同時在協調者和參與者中都引入超時機制,當參與者
各種原因未收到協調者
的commit請求後,會對本地事務進行commit,不會一直阻塞等待,解決了2PC
的單點故障問題,但3PC
還是沒能從根本上解決數據一致性的問題。
3PC 的三個階段分別是CanCommit
、PreCommit
、DoCommit
CanCommit:協調者向所有參與者發送CanCommit命令,詢問是否可以執行事務提交操作。如果全部響應YES則進入下一個階段。
PreCommit:
協調者
向所有參與者
發送PreCommit
命令,詢問是否可以進行事務的預提交操作,參與者接收到PreCommit請求後,如參與者成功的執行了事務操作,則返回Yes
響應,進入最終commit階段。一旦參與者中有向協調者發送了No
響應,或因網絡造成超時,協調者沒有接到參與者的響應,協調者向所有參與者發送abort
請求,參與者接受abort命令執行事務的中斷。DoCommit:在前兩個階段中所有參與者的響應反饋均是
YES
後,協調者向參與者發送DoCommit
命令正式提交事務,如協調者沒有接收到參與者發送的ACK響應,會向所有參與者發送abort
請求命令,執行事務的中斷。
3、補償事務(TCC)
很多初學者總是被TCC
、2PC
、3PC
這幾個概念搞混淆,傻傻分不清,實際上 TCC
與 2PC
、3PC
一樣,都只是實現分佈式事務的一種方案而已。
TCC
(Try-Confirm-Cancel)又被稱補償事務
,TCC
與2PC
的思想很相似,事務處理流程也很相似,但2PC
是應用於在DB層面,TCC則可以理解爲在應用層面的2PC
,是需要我們編寫業務邏輯來實現。
TCC
它的核心思想是:"針對每個操作都要註冊一個與其對應的確認(Try)和補償(Cancel)"。
還拿下單扣庫存解釋下它的三個操作:
Try階段:
下單時通過Try操作去扣除庫存預留資源。
Confirm階段:
確認執行業務操作,在只預留的資源基礎上,發起購買請求。
Cancel階段:
只要涉及到的相關業務中,有一個業務方預留資源未成功,則取消所有業務資源的預留請求。
TCC的缺點:
-
應用侵入性強:TCC由於基於在業務層面,至使每個操作都需要有
try
、confirm
、cancel
三個接口。 -
開發難度大:代碼開發量很大,要保證數據一致性
confirm
和cancel
接口還必須實現冪等性。
總結
很淺顯的介紹了一下2PC、3PC、TCC的概念,如有錯誤還望溫柔指正,分佈式事務一直都是面試中比較熱點的問題,也是進階高級Java工程師必備的知識點。