mysql 分庫分表，真的能支持服務無限擴容麼？

原創

我是月亮呀

2020-02-24 07:27

剛開始工作的菜鳥，總會有各種疑問，剛開始是對 JDK API 的疑問，對 NIO 的疑問，對 JVM 的疑問，當工作幾年後，對服務的可用性，可擴展性也有了新的疑問，什麼疑問呢？其實是老生常談的話題：服務的擴容問題。

正常情況下的服務演化之路

讓我們從最初開始。

1、單體應用

每個創業公司基本都是從類似 SSM 和 SSH 這種架構起來的，沒什麼好講的，基本每個程序員都經歷過。

2、RPC 應用

當業務越來越大，我們需要對服務進行水平擴容，擴容很簡單，只要保證服務是無狀態的就可以了，如下圖：

當業務又越來越大，我們的服務關係錯綜複雜，同時，有很多服務訪問都是不需要連接 DB 的，只需要連接緩存即可，那麼就可以做成分離的，減少 DB 寶貴的連接。如下圖：

我相信大部分公司都是在這個階段。Dubbo 就是爲了解決這個問題而生的。

3、分庫分表

如果你的公司產品很受歡迎，業務繼續高速發展，數據越來越多，SQL 操作越來越慢，那麼數據庫就會成爲瓶頸，那麼你肯定會想到分庫分表，不論通過 ID hash 或者 range 的方式都可以。如下圖：

這下應該沒問題了吧。任憑你用戶再多，併發再高，我只要無限擴容數據庫，無限擴容應用，就可以了。

分庫分表真的就能解決無限擴容嗎？

實際上，像上面的架構，並不能解決。

其實，這個問題和 RPC 的問題有點類似：數據庫連接過多！！！

通常，我們的 RPC 應用由於是使用中間件進行訪問數據庫，應用實際上是不知道到底要訪問哪個數據庫的，訪問數據庫的規則由中間件決定，例如sharding JDBC。這就導致，這個應用必須和所有的數據庫連接，就像我們上面的架構圖一樣，一個 RPC 應用需要和 3 個 mysql
連接，如果是 30 個 RPC 應用，每個 RPC 的數據庫連接池大小是8 ，每個 mysql 需要維護 240個連接，我們知道，mysql 默認連接數是 100，最大連接數是 16384，也就是說，假設每個應用的連接池大小是 8 ，超過 2048個應用就無法再繼續連接了，也就無法繼續擴容了。注意，由於每個物理庫有很多邏輯庫，再加上微服務運動如火如荼， 2048 並沒有看起來那麼大。

也許你說，我可以通過前面加一個 proxy 來解決連接數的問題，實際上，代理的性能也會成爲問題，爲什麼？代理的連接數也是不能超過 16384 的，如果併發超過 16384，變成 163840，那麼 proxy 也解決不了問題。

怎麼辦？讓我們再看看上面的架構圖：

我們發現，問題是出在“每個 RPC 應用都要連所有的庫”，導致擴容應用的同時，每個數據庫連接數就要增加。就算增加數據庫，也不能解決連接數的問題。

那怎麼辦呢？

單元化

單元化，聽起來高大上，通常在一些 XXX 大會上，分享“關於兩地三中心”，“三地五中心”，“異地多活”等等牛逼的名詞的時候，單元化也會一起出現。

這裏我們不討論那麼牛逼的，就只說“數據庫連接數過多” 的問題。

實際上，思路很簡單：我們不讓應用連接所有的數據庫就可以了。

假設我們根據 range 分成了 10 個庫，現在有 10 個應用，我們讓每個應用只連一個庫，當應用增多變成 20個，數據庫的連接不夠用了，我們就將 10 個庫分成 20 個庫，這樣，無論你應用擴容到多少個，都可以解決數據庫連接數過多的問題。

注意：做這件事的前提是：你必須保證，訪問你這個應用的 request 請求的數據庫一定是在這個應用的。

換個說法，當用戶從 DNS那裏進來的時候，就知道自己要去那個應用了，所以，規則在 DNS 之前就定好了，雖然這有點誇張，但肯定在進應用之前就知道要去哪個庫了。

所以，這通常需要一個規則，例如通過用戶 ID hash，由配置中心廣播 hash 規則。這樣，所有的組件都能保持一致的規則，從而正確的訪問到數據庫。如下圖：

到這裏，我們終於解決了無限擴容的問題。

最後

本文從單體應用開始，逐步講述了一個正常後臺的演進歷程，知道了分庫分表並不能解決“無限擴容” 的問題，只有單元化才能解決這問題。而單元化則帶來更多的複雜性。但是好處不言而喻。

單元化帶來的更多的思路。

有了單元化，解決了無限擴容的問題，但是我們還沒有考慮單點的問題，即服務的可用性。要知道，我們這裏的數據庫都是單點的。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

mysql 分庫分表，真的能支持服務無限擴容麼？

正常情況下的服務演化之路

1、單體應用

2、RPC 應用

3、分庫分表

單元化

最後

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

大齡程序員思考

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

Java併發編程40道面試題及答案——大廠面試穩了！

看完不要再說自己不懂ZooKeeper，純乾貨技術分享！

2019年面試必備：最新Java核心知識點（1）—JVM

Redis的Linux系統優化

面試題：你簡歷中寫到熟悉Spring源碼，那你給我說說它用到了那些設計模式？

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結