前言
本篇是上一篇《一次分表踩坑實踐的探討》,所以還沒看過的朋友建議先看上文。
還是先來簡單回顧下上次提到了哪些內容:
- 分表策略:哈希、時間歸檔等。
- 分表字段的選擇。
- 數據遷移方案。
而本篇文章的背景是在我們上線這段時間遇到的一些問題並嘗試解決的方案。
問題產生
之前提到在分表應用上線前我們需要將原有表的數據遷移到新表中,這樣才能保證業務不受影響。
所以我們單獨寫了一個遷移應用,它負責將大表中的數據遷移到 64 張分表,而再遷移過程中產生的數據畢竟是少數,最後在上線當晚再次遷移過去即可。
一切想的很美好,當這個應用上線後卻發現沒這麼簡單。
數據庫負載升高
首先第一個問題是數據庫自己就頂不住了,在我們上這個遷移程序之前數據庫的壓力本身就比較大,這個應用一上去就成了最後一根稻草。
最後導致的結果是:所有連接了數據庫的程序大部分的操作都出現超時,獲取不到數據庫連接等一系列的異常。
最後沒辦法我們只能把這個應用放到凌晨執行,但其實後面觀察發現依然不行。
雖說凌晨的業務量下降,但依然有少部分的請求過來,也會出現各種數據庫異常。
再一個是遷移程序的效率也非常低下,按照這樣是速度,我們預估了一下遷移時間,大約需要 10 幾天才能把三張最大的表(3、4億的數據)遷移到分表中。
於是我們換了一個方案,將這個遷移程序在從庫中運行,最後再用運維的方法將分表直接導入進主庫。
因爲從庫的壓力要比主庫小很多,對業務的影響很小,同時遷移的效率也要快很多。
即便是這樣也花了一晚上+一個白天的時間纔將一張 1億的數據遷移完成,但是業務上的壓力越來越大,數據量再不斷新增,這個效率依然不夠。
兼容方案
最終沒辦法只有想一個不遷移數據的方案,但是新產生的數據還是往分表裏寫,至少保證大表的數據不再新增。
但這樣對於以前的數據咋辦呢?總不能不讓看了吧。
其實對於數據的操作無非就分爲增刪改查
,就這四種操作來看看如何兼容。
新增
新增最簡單,所有的數據根據分表規則直接寫入新表,這樣可以保證老表的數據不再新增。
刪除
刪除就要比新增稍微複雜一些,比如用戶想要刪除他個人產生的一條信息(比如說是訂單數據),有可能這個數據在新表也可能在老表。
所以刪除時優先刪除新表(畢竟新產生的數據訪問的頻次越高),如果刪除失敗再從老表刪除一次。
修改
而修改同理,同樣的會不確定數據存在於哪裏,所以先要修改新表,失敗後再次修改老表。
查詢
查詢相對就要複雜一些了,因爲這些大表的數據大部分都是存放一個用戶產生的多條記錄(比如一個用戶的訂單信息)。
這時在頁面上通常都會有分頁,並且按照時間進行排序。
麻煩的地方就出在這裏:既然是要分頁那就有可能出現要查詢一部分分表數據和原來的大表數據做組合。
所以這裏的查詢其實分爲三種情況。
- 首先查詢的時候要計算這個用戶所在分表中的數據可以分爲幾頁。
- 第一步首先判斷當前頁是否可以在分表中全部獲取,如果可以則直接從分表中取出數據返回(假設分頁中總共可以查詢 2 頁數據,當前爲第 1 頁,那就全部取分表數據)。
- 如果不可以就要判斷當前頁數在分表中是否取不到任何一條數據,如果是則直接取老表數據(比如現在要取第 5 頁的數據,分表中一共才只有 2 頁數據,所以第 5 頁數據只能全部從老表中獲取)。
- 但如果分表和老表都存在一部分數據時,則需要同時取兩張表然後做一個彙總再返回。
這種邏輯只適用於根據分表字段進行查詢分頁的前提下
我想肯定會有朋友提出這樣是否會有性能問題?
同時如果在計算分表分頁數量時出現併發寫入的情況,導致分頁數量不準從而對後續的查詢出現影響該怎麼處理?
首先第一個性能問題:
其實這個要看怎麼取捨,爲了這樣的兼容目的其實會比常規查詢多出幾個步驟:
- 判斷當前頁是否可以在分表中查詢。
- 當新老表中都有數據時候需要額外多查詢一張大表。
第一個判斷邏輯其實是在內存中計算,這個損耗我覺得完全可以忽略不計。
至於第二步確實會有損耗,畢竟多查了一張表。
但在分表之前所有的數據都是從老表中獲取的,當時的業務也沒有出現問題;現在多的只是查詢分表而已,但分表的數據量肯定要比大表小的多,而且有索引,所以這個效率也不會慢多少。
而且根據局部性原理及用戶的使用習慣來看,老表中的數據很少會去查詢,隨着時間的推移所有的數據肯定都會從分表中獲取,逐漸老表就會成爲歷史表。
而第二個併發帶來的問題我覺得影響也不大,一定要這個分頁準的前提肯定得是加鎖了,但爲了這樣一個不癢的小問題卻帶來性能的下降,我覺得是不划算的。
而且後續我們也可以慢慢的將老表的數據遷移到新表,這樣就可以完全去掉這個兼容邏輯了,所有的數據都從分表中獲取。
總結
還是之前那句話,這裏的各種操作、方法不適合所有人,畢竟脫離場景都是耍牛氓。
比如分表搞的早,業務上允許一定的時間將數據遷移到分表那就不會有這次的兼容處理。
甚至一開始業務規劃合理、團隊架構師看的長遠,一來就將關鍵數據分表存儲那根本就不會有數據遷移這個流程(大廠有經驗的團隊可能,小公司小作坊都得靠自己摸索)。
這段期間也被數據庫折騰慘了,數據庫是最後一根稻草果然也不是瞎說的。
你的點贊與分享是對我最大的支持