阿里雲DTS原理

系統架構

DTS系統架構

架構說明

  • 系統高可用

    數據傳輸服務內部每個模塊都有主備架構,保證系統高可用。容災系統實時檢測每個節點的健康狀況,一旦發現某個節點異常,會將鏈路秒級切換到其他節點。

  • 數據源地址動態適配

    對於數據訂閱及同步鏈路,容災系統還會監測數據源的連接地址切換等變更操作,一旦發現數據源發生連接地址變更,它會動態適配數據源新的連接方式,在數據源變更的情況下,保證鏈路的穩定性。

數據遷移基本原理

數據遷移工作原理

數據遷移提供多種遷移類型:結構對象遷移、全量數據遷移及增量數據遷移。如果需要實現不停服遷移,需要選擇結構對象遷移、全量數據遷移和增量數據遷移。

對於異構數據庫之間的遷移,DTS會從源庫讀取結構定義語法,根據目標數據庫的語法定義,將語法重新組裝成目標數據庫的語法格式,並導入到目標實例中。

全量數據遷移過程持續較久,在這過程中,源實例不斷有業務寫入,爲保證遷移數據的一致性,在全量數據遷移之前會啓動增量數據拉取模塊,增量數據拉取模塊會拉取源實例的增量更新數據,並解析、封裝、存儲在本地存儲中。

當全量數據遷移完成後,DTS會啓動增量日誌回放模塊,增量日誌回放模塊會從增量日誌讀取模塊中獲取增量數據,經過反解析、過濾、封裝後遷移到目標實例,從而實現增量數據遷移。

實時同步基礎原理

數據同步工作原理

實時同步功能能夠實現兩個數據源之間的增量數據實時同步。DTS將陸續支持OLTP->OLAP的數據實時同步。

同步鏈路的創建過程如下:

  • 同步初始化

    將源實例的歷史存量數據在目標實例初始化一份。

  • 增量數據實時同步

    當初始化完成後進入兩邊增量數據實時同步階段,該階段DTS將實現源實例和目標實例的數據動態同步。

增量數據實時同步過程,DTS的底層實現模塊主要包括:

  • 日誌讀取模塊

    日誌讀取模塊從源實例讀取原始數據,經過解析、過濾及標準格式化,最終將數據在本地持久化。日誌讀取模塊通過數據庫協議連接並讀取源實例的增量日誌。如果源數據庫爲RDS MySQL,那麼數據抓取模塊通過Binlog dump協議連接源庫。

  • 日誌回放模塊

    日誌回放模塊從日誌讀取模塊中請求增量數據,並根據用戶配置的同步對象進行數據過濾,然後在保證事務時序性及事務一致性的前提下,將日誌記錄同步到目標實例。

DTS具備日誌讀取模塊、日誌回放模塊的高可用,DTS容災系統一旦檢測到鏈路異常,就會在健康服務節點上斷點重啓鏈路,從而有效保證同步鏈路的高可用。

數據訂閱基礎原理

數據訂閱工作原理

數據訂閱支持實時拉取RDS實例的增量日誌,用戶可以通過DTS提供的SDK數據訂閱服務端來訂閱增量日誌,同時可以根據業務需求,實現數據定製化消費。

DTS服務端的日誌拉取模塊主要實現從數據源抓取原始數據,通過解析、過濾、標準格式化等流程,最終將增量數據在本地持久化。

日誌抓取模塊通過數據庫協議連接並實時拉取源實例的增量日誌。例如源實例爲RDS MySQL,那麼數據抓取模塊通過Binlog dump協議連接源實例。

日誌拉取模塊及下游消費SDK的高可用:

  • DTS容災系統一旦檢測到日誌拉取模塊出現異常,就會在健康服務節點上斷點重啓日誌拉取模塊,保證日誌拉取模塊的高可用。
  • DTS支持在服務端實現下游SDK消費進程的高可用。用戶同時對一個數據訂閱鏈路,啓動多個下游SDK消費進程,服務端同時只向一個下游消費推送增量數據,當這個消費進程異常後,服務端會從其他健康下游中選擇一個消費進程,向這個消費進程推送數據,從而實現下游消費的高可用。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章