[深度] Seata TCC 分佈式事務源碼分析

Seata 是什麼

Seata 是阿里近期開源的分佈式事務框架,地址:https://github.com/seata/seata。框架包括了集團的 TXC(雲版本叫 GTS)和螞蟻金服的 TCC 兩種模式,短短數月 Github 上的 star 數已經接近一萬,算是目前唯一有大廠背書的分佈式事務解決方案。

TXCSeata 中又叫 AT 模式,意爲補償方法是框架自動生成的,對用戶完全屏蔽,用戶可以向使用本地事務那樣使用分佈式事務,缺點是僅支持關係型數據庫(目前支持 MySQL),引入 Seata AT 的服務需要本地建表存儲 rollback_info,隔離級別默認 RU 適用場景有限。

TCC 不算是新概念,很早就有了,用戶通過定義 try/confirm/cancel 三個方法在應用層面模擬兩階段提交,區別在於 TCC 中 try 方法也需要操作數據庫進行資源鎖定,後續兩個補償方法由框架自動調用,分別進行資源提交和回滾,這點同單純的存儲層 2PC 不太一樣。螞蟻金服向 Seata 貢獻了自己的 TCC 實現,據說已經演化了十多年,大量應用在在金融、交易、倉儲等領域。

分佈式事務的誕生背景

早期應用都是單一架構,例如支付服務涉及到的賬戶、金額、訂單系統等都由單一應用負責,底層訪問同一個數據庫實例,自然事務操作也是本地事務,藉助 Spring 可以輕鬆實現;但是由於量級越來越大,單一服務需要進行職責拆分變爲三個獨立的服務,通過 RPC 進行調用,數據也存在不同的數據庫實例中,由於這時一次業務操作涉及對多個數據庫數據的修改,無法再依靠本地事務,只能通過分佈式事務框架來解決。

TCC 就是分佈式事務的一種解決方案,屬於柔性補償型,優點在於理解簡單、僅 try 階段加鎖併發性能較好,缺點在於代碼改造成本。

什麼是 TCC 本文就不再贅述了,TCC 的概念本身並不複雜

Seata TCC 使用方法

在分析源碼之前,我們先簡要提及下 Seata TCC 模式的使用方法,有助於後續理解整個 TCC 流程。

Seata TCC 參與方

Seata 中的 TCC 模式要求 TCC 服務的參與方在接口上增加 @TwoPhaseBusinessAction 註解,註明 TCC 接口的名稱(全局唯一),TCC 接口的 confirmcancel 方法的名稱,用於後續框架反射調用,下面是一個 TCC 接口的案例:

public interface TccAction {
    @TwoPhaseBusinessAction(name = "yourTccActionName", commitMethod = "confirm", rollbackMethod = "cancel")
    public boolean try(BusinessActionContext businessActionContext, int a, int b);
    public boolean confirm(BusinessActionContext businessActionContext);
    public boolean cancel(BusinessActionContext businessActionContext);
}

緊接着定義實現類 Impl 實現這個接口,爲三個方法提供具體實現。最後將參與方服務進行發佈,註冊到遠端,主要爲了後續能讓 Seata 框架調用到參與方的 confirm 或者 cancel 方法閉環整個 TCC 事務。

Seata TCC 發起方

Seata TCC 的發起方類似於我們上圖中的 payment service,參與方需要在業務方法上增加 @GlobalTransactional 註解,用於開啓切面註冊全局事務,業務方法中調用 TCC 參與方的若干 try 方法,一旦業務方法調用成功,Seata 框架會通知 TC 回調這些參與方的 confirmcancel 方法。

源碼分析

SeataTCC 模式的源碼並不複雜,主要集中於:

module class 功能
seata-spring GlobalTransactionalInterceptor.class 全局事務切面邏輯,包括註冊全局事務,拿到 xid
seata-spring TccActionInterceptor.class TCC 參與方切面邏輯
seata-tcc TCCResourceManager.class 解析 TCC Bean,保存 TCC Resources,便於後續回調
seata-tcc ActionInterceptorHandler.class TCC 分支事務註冊實現
seata-server DefaultCoordinator.class、FileTransactionStoreManager.class 主要是 TC 的實現、事務存儲等實現

註冊 TCC Resources

Seata 中一個 TCC 接口被稱作一個 TCC Resources,其結構如下:

public class TCCResource implements Resource {

    private String resourceGroupId = "DEFAULT";

    private String appName;

    private String actionName; // TCC 接口名稱     

    private Object targetBean; // TCC Bean

    private Method prepareMethod; // try 方法

    private String commitMethodName;

    private Method commitMethod; // confirm 方法

    private String rollbackMethodName;

    private Method rollbackMethod; // cancel 方法

    // …… 省略
}

Seata 解析到應用中存在 TCC Bean,則通過 parserRemotingServiceInfo 方法生成一個 TCCResource 對象,進而調用 TCCResourceManager 類的 registerResource 方法,將 TCCResource 對象保存到本地的 tccResourceCache 中,它是一個 ConcurrentHashMap 結構,同時通過 RmRpcClient 將該 TCCResourceresourceIdaddress 等信息註冊到服務端,便於後續 TC 通過 RPC 回調到正確的地址。

// 解析 TCCResource 的部分代碼
Class<?> interfaceClass = remotingBeanDesc.getInterfaceClass();
Method[] methods = interfaceClass.getMethods();
if(isService(bean, beanName)){
    try {
        // 如果是 TCC service Bean,解析並註冊該 resource
        Object targetBean = remotingBeanDesc.getTargetBean();
        for(Method m : methods){
            TwoPhaseBusinessAction twoPhaseBusinessAction = m.getAnnotation(TwoPhaseBusinessAction.class);
            if(twoPhaseBusinessAction != null){
                // 如果有 TCC 參與方註解,定義一個 TCCResource,
                TCCResource tccResource = new TCCResource();
                tccResource.setActionName(twoPhaseBusinessAction.name());
                // TCC Bean
                tccResource.setTargetBean(targetBean); 
                // try 方法
                tccResource.setPrepareMethod(m); 
                // confirm 方法名稱
                tccResource.setCommitMethodName(twoPhaseBusinessAction.commitMethod());
                // confirm 方法對象
                tccResource.setCommitMethod(ReflectionUtil.getMethod(interfaceClass, twoPhaseBusinessAction.commitMethod(), new Class[]{BusinessActionContext.class}));
                // cancel 方法名稱
                tccResource.setRollbackMethodName(twoPhaseBusinessAction.rollbackMethod());
                // cancel 方法對象
                tccResource.setRollbackMethod(ReflectionUtil.getMethod(interfaceClass, twoPhaseBusinessAction.rollbackMethod(), new Class[]{BusinessActionContext.class}));
                // 調用到 TCCResourceManager 的 registerResource 方法
                DefaultResourceManager.get().registerResource(tccResource);
            }
        }
    }catch (Throwable t){
        throw new FrameworkException(t, "parser remting service error");
    }
}

我們看一下 TCCResourceManagerregisterResource 方法的實現:

// 內存中保存的 resourceId 和 TCCResource 的映射關係
private Map<String, Resource> tccResourceCache = new ConcurrentHashMap<String, Resource>();

@Override
public void registerResource(Resource resource) {
    TCCResource tccResource = (TCCResource) resource;
    tccResourceCache.put(tccResource.getResourceId(), tccResource);
    // 調用父類的方法通過 RPC 註冊到遠端
    super.registerResource(tccResource);
}

我們看下 TCCResource 是如何註冊到服務端的:

public void registerResource(Resource resource) {
    // 拿到 RmRpcClient 實例,調用其 registerResource 方法
    RmRpcClient.getInstance().registerResource(resource.getResourceGroupId(), resource.getResourceId());
}

public void registerResource(String resourceGroupId, String resourceId) {
    if (LOGGER.isInfoEnabled()) {
        LOGGER.info("register to RM resourceId:" + resourceId);
    }
    synchronized (channels) {
        for (Map.Entry<String, Channel> entry : channels.entrySet()) {
            String serverAddress = entry.getKey();
            Channel rmChannel = entry.getValue();
            if (LOGGER.isInfoEnabled()) {
                LOGGER.info("register resource, resourceId:" + resourceId);
            }
            // 註冊 resourceId,遠端將其解析爲一個 RpcContext 保存在內存中
            sendRegisterMessage(serverAddress, rmChannel, resourceId);
        }
    }
}

GlobalTransaction 註冊全局事務

GlobalTransaction 註解是全局事務的入口,其切面邏輯實現在 GlobalTransactionalInterceptor 類中。如果判斷進入 @GlobalTransaction 修飾的方法,會調用 handleGlobalTransaction 方法進入切面邏輯,其中關鍵方法是 transactionalTemplateexecute 方法。

public Object execute(TransactionalExecutor business) throws Throwable {
    
    // 如果上游已經有 xid 傳過來說明自己是下游,直接參與到這個全局事務中就可以,不必新開一個,角色是 Participant
    // 如果上游沒有 xid 傳遞過來,說明自己是發起方,新開啓一個全局事務,角色是 Launcher
    GlobalTransaction tx = GlobalTransactionContext.getCurrentOrCreate();

    // …… …… 省略 

    try {

        // 開啓全局事務
        beginTransaction(txInfo, tx);

        Object rs = null;
        try {

            // 調用業務方法
            rs = business.execute();

        } catch (Throwable ex) {

            // 如果拋異常,通知 TC 回滾全局事務
            completeTransactionAfterThrowing(txInfo,tx,ex);
            throw ex;
        }

        // 如果不拋異常,通知 TC 提交全局事務
        commitTransaction(tx);

        return rs;
    } 

    // …… …… 省略
}

beginTransaction 方法調用了 transactionManagerbegin 方法:

// 客戶端
@Override
public String begin(String applicationId, String transactionServiceGroup, String name, int timeout)
    throws TransactionException {
    GlobalBeginRequest request = new GlobalBeginRequest();
    request.setTransactionName(name);
    request.setTimeout(timeout);
    // 發送 RPC,獲取 TC 下發的 xid
    GlobalBeginResponse response = (GlobalBeginResponse)syncCall(request);
    return response.getXid();
}

// 服務端
@Override
public String begin(String applicationId, String transactionServiceGroup, String name, int timeout)
    throws TransactionException {
    // 全局事務用 GlobalSession 來表示
    GlobalSession session = GlobalSession.createGlobalSession(
        applicationId, transactionServiceGroup, name, timeout);
    session.addSessionLifecycleListener(SessionHolder.getRootSessionManager());
    // 將 GlobalSession 寫入文件存儲
    session.begin();
    // 返回 UUID 作爲全局事務 ID
    return XID.generateXID(session.getTransactionId());
}

TwoPhaseBusinessAction 註冊分支事務

全局事務調用業務方法時,會進入 TCC 參與方的切面邏輯,主要實現在 TccActionInterceptor 類中,關鍵方法是 actionInterceptorHandlerproceed 方法。

public Map<String, Object> proceed(Method method, Object[] arguments, TwoPhaseBusinessAction businessAction, Callback<Object> targetCallback) throws Throwable {
    
    // …… …… 省略

    // 創建分支事務
    String branchId = doTccActionLogStore(method, arguments, businessAction, actionContext);
    actionContext.setBranchId(branchId);
    
    // 記錄方法參數
    Class<?>[] types = method.getParameterTypes();
    int argIndex = 0;
    for (Class<?> cls : types) {
        if (cls.getName().equals(BusinessActionContext.class.getName())) {
            arguments[argIndex] = actionContext;
            break;
        }
        argIndex++;
    }
    
    // …… …… 省略
}

doTccActionLogStore 方法負責註冊分支事務:

// 客戶端
protected String doTccActionLogStore(Method method, Object[] arguments, TwoPhaseBusinessAction businessAction, BusinessActionContext actionContext) {
    String actionName = actionContext.getActionName();
    // 拿到全局事務 ID
    String xid = actionContext.getXid();
    
    // …… …… 省略

    try {
        // resourceManager 通過 RPC 向 TC 註冊分支事務
        Long branchId = DefaultResourceManager.get().branchRegister(BranchType.TCC, actionName, null, xid, applicationContextStr, null);
        // 拿到 TC 返回的分支事務 ID
        return String.valueOf(branchId);
    }

    // …… …… 省略
}

// 服務端
@Override
public Long branchRegister(BranchType branchType, String resourceId, String clientId, String xid,
                            String applicationData, String lockKeys) throws TransactionException {
    GlobalSession globalSession = assertGlobalSession(XID.getTransactionId(xid), GlobalStatus.Begin);
    // 分支事務用 BranchSession 表示,新建一個 BranchSession
    BranchSession branchSession = SessionHelper.newBranchByGlobal(globalSession, branchType, resourceId,
        applicationData, lockKeys, clientId);

    if (!branchSession.lock()) {
        throw new TransactionException(LockKeyConflict);
    }
    try {
        // 將分支事務加入全局事務中,也會寫文件
        globalSession.addBranch(branchSession);
    } catch (RuntimeException ex) {
        throw new TransactionException(FailedToAddBranch);
    }
    // 返回分支事務 ID
    return branchSession.getBranchId();
}

TC 回調參與方補償方法

分支事務註冊完畢,業務方法調用成功則通知 TC 提交全局事務。

@Override
public void commit() throws TransactionException {
    // 如果是參與者,無需發起提交請求
    if (role == GlobalTransactionRole.Participant) {
        return;
    }
    // 由 TM 向 TC 發出提交全局事務的請求
    status = transactionManager.commit(xid);
}

TC 收到客戶端 TMcommit 請求後:

@Override
public GlobalStatus commit(String xid) throws TransactionException {
    // 根據 xid 找出 GlobalSession
    GlobalSession globalSession = SessionHolder.findGlobalSession(XID.getTransactionId(xid));
    if (globalSession == null) {
        return GlobalStatus.Finished;
    }
    GlobalStatus status = globalSession.getStatus();

    // 關閉這個 GlobalSession,不讓後續的分支事務再註冊上來
    globalSession.closeAndClean(); 

    if (status == GlobalStatus.Begin) {
        // 修改狀態爲提交進行中
        globalSession.changeStatus(GlobalStatus.Committing);
        // 一旦分支事務中存在 TCC,做同步提交,其實 TCC 分支也可以異步提交,要求高性能時可以選擇異步
        if (globalSession.canBeCommittedAsync()) {
            asyncCommit(globalSession);
        } else {
            doGlobalCommit(globalSession, false);
        }
    }
    return globalSession.getStatus();
}

doGlobalCommit 是我們關注的關鍵方法,我們忽略其中的次要邏輯:

@Override
public void doGlobalCommit(GlobalSession globalSession, boolean retrying) throws TransactionException {
    for (BranchSession branchSession : globalSession.getSortedBranches()) {
        
        // …… …… 省略

        try {
            // 調用 DefaultCoordinator 的 branchCommit 方法做分支提交
            // 參數有分支事務 id,resourceId 用來尋找對應的 TCCResource 和補償方法參數信息
            BranchStatus branchStatus = resourceManagerInbound.branchCommit(branchSession.getBranchType(),
                XID.generateXID(branchSession.getTransactionId()), branchSession.getBranchId(),
                branchSession.getResourceId(), branchSession.getApplicationData());
        }
    }

    // …… …… 省略
}

服務端的 DefaultCoordinator 類中的 branchCommit 方法發出 RPC 請求,調用對應 TCCResource 提供方:

@Override
public BranchStatus branchCommit(BranchType branchType, String xid, long branchId, String resourceId,
                                    String applicationData)
    throws TransactionException {
    
    // …… …… 省略
    // 獲取全局事務和分支事務
    GlobalSession globalSession = SessionHolder.findGlobalSession(XID.getTransactionId(xid));
        BranchSession branchSession = globalSession.getBranch(branchId);
    // 根據 resourceId 找到對應的 channel 和 RpcContext 
    BranchCommitResponse response = (BranchCommitResponse)messageSender.sendSyncRequest(resourceId,
        branchSession.getClientId(), request);
    // 返回分支事務提交狀態
    return response.getBranchStatus();

    // …… …… 省略
}

客戶端自然是接收到分支提交的 RPC 請求,然後本地找出之前解析並保持下來的 TCCResource 進行補償方法的反射調用,下面我們截取其中的關鍵步驟進行分析。

@Override
public BranchStatus branchCommit(BranchType branchType, String xid, long branchId, String resourceId, String applicationData) throws TransactionException {
    // 根據 resourceId 找出內存中保留的 TCCResource 對象
    TCCResource tccResource = (TCCResource) tccResourceCache.get(resourceId);
    if(tccResource == null){
        throw new ShouldNeverHappenException("TCC resource is not exist, resourceId:" + resourceId);
    }
    // 獲取 targetBean 和相應的 method 對象
    Object targetTCCBean = tccResource.getTargetBean();
    Method commitMethod = tccResource.getCommitMethod();
    try {
        boolean result = false;
        // 取出補償方法參數信息
        BusinessActionContext businessActionContext = getBusinessActionContext(xid, branchId, resourceId, applicationData);
        // 反射調用補償方法
        Object ret = commitMethod.invoke(targetTCCBean, businessActionContext);
        // 返回狀態
        return result ? BranchStatus.PhaseTwo_Committed:BranchStatus.PhaseTwo_CommitFailed_Retryable;
    }
    // …… …… 省略
}

事務存儲

關於 Seata TC 模塊如何進行事務存儲,網上有的文章已經講得很詳細,例如 深度剖析一站式分佈式事務方案 Seata-Server,因此這裏不再贅述。

需要提及的一點是,TC 有可能成爲整個分佈式事務服務的性能瓶頸,因此如何做到高性能高可用很重要,目前的存儲方式是 File,代碼中也有關於 DB Store ModeTODO 項,文件相比於 DB 性能肯定好一些但是可用性會差一點,這塊怎麼保證要等到後續 HA Cluster 發佈之後再看。

總結

整個 Seata 框架中關於 TCC 部分的源碼並不複雜,本文只選取了部分類中的關鍵代碼進行展示,忽略了一些判斷邏輯和異常處理,筆者認爲 Seata TCC 中關於 TCC 異常的封裝和自定義處理、還有各種用戶擴展埋點的設計也值得一看。

螞蟻 SOFA Channel 之前做過一個關於 Seata TCC Seata TCC 分享 的講解裏也提到,TCC 框架的難點不在於本身,而在於如何寫好一個 TCC 接口,如果對這部分內容感興趣,可以點擊鏈接進行詳細瞭解。

寫在最後

這是一個不定時更新的、披着程序員外衣的文青小號,歡迎關注。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章