分庫分表-首次上線-老數據-數據遷移

爲什麼要分庫分表，分庫分表的實踐請看之前的文章：微服務-分庫分表思路

分庫分表之前我們首先要選出分片字段、然後根據一定的分片算法將數據寫入不同的庫表，查詢數據的時候根據分片字段+分片算法從對應的庫表中拿取數據即可

因此，由單獨進行橫向拆分後需要將老數據按照我們定義的，分片字段和分片算法重新洗數據，那麼我們本節主要講解3中方法：停機數據遷移、新老庫雙寫、寫老庫通過binlog同步新庫

實踐思路：

優點：

缺點：

題外話：最後一步一定要做數據校驗，如果停服務的話一般校驗數據總條數即可，如果同步過程中出現錯誤，一定要記錄，否則數據矯正略麻煩；如果真的出現數據不一致的情況，提供一直校驗思路：

同樣的查詢條件分表查詢新老庫，分別MD5，然後做對比

上一種爲什麼要停服務：就是怕在遷移過程中，有數據修改出現數據不一致的情況，那麼爲了解決數據不一致的情況我們可以在遷移過程中寫的數據，同時寫入新老庫

流程解釋：

新建線上新庫（按照分片鍵+分片算法新建）
修改源碼，將之前代碼新增、修改、刪除的地方都修改成同時寫新老庫
1. 寫入數據庫中間件之前先判斷新庫中是否有此次操作的數據
2. 新增操作：如果新庫無數據：直接新增，如果有數據：直接丟棄
3. 修改操作：如果新庫有數據：確保新數據覆蓋舊數據，如果無數據：直接丟棄
4. 刪除操作：如果新庫有數據：直接刪除，如果無數據：直接丟棄
啓動後臺數據遷移程序
1. 查詢老庫，查出數據後通過新庫規則查詢新庫，如果無數據直接寫入，如果有數據比較時間戳，確保新數據覆蓋舊數據，如果是老數據想覆蓋新數據，直接丟棄
數據遷移完畢後，進行數據校驗
修改源碼，將之前同時寫新老庫的地方全部改成只寫新庫
經過一段時間，無異常後下掉老庫和遷移工具

優點：

缺點：

總結：上種方法需要很多的判斷，判斷新庫中是否有數據，如果有怎麼處理，如果沒有怎麼處理，牽扯到了一些邏輯，因此我們有沒有一種辦法不用判斷

第二種優化策略

解釋：

總體思路：先遷移老數據，然後消費新數據，不需要各種邏輯判斷

當然缺點還是沒有避免，還是要修改源碼，有沒有不修改源碼的呢，，，

解釋：

題外話：監聽binlog增刪改事件可以用阿里的canal

公衆號主要記錄各種源碼、面試題、微服務技術棧，幫忙關注一波，非常感謝

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.