數據庫水平拆分之ID生成策略

原創

2021-04-05 09:18

衆所周知，數據分片包括水平和垂直，這裏只討論水平這種情況，並且，我們默認數據的切分規則是以ID。

細化下來，其實主要是討論兩種情況：ID爲UUID或者說無序的字符串的情況，以及ID是數字形式的情況。前者無序，後者有序。

當ID是無序字符串的時候，一般採用將ID哈希後再取模的形式，而數字則直接取模。從原理上說，前者無法保證數據徹底均勻的分佈在各個表中，而後者則沒有這種情況。

但，空口無憑，一切還是要以事實爲依據，做到心中有數。所以，我創建了10張測試表，準備插入100萬條數據，用來探索UUID形式的ID加哈希這種算法的數據分佈情況。當然，其實有更簡單的方式，直接生成100萬個UUID然後哈希取模並計數就行了。不過，我正好測試Sharding JDBC，算是順勢而爲吧。

數據如下：

表名	數據量
t0	100032
t1	100315
t2	99452
t3	99762
t4	100001
t5	99791
t6	100614
t7	100373
t8	99796
t9	99864

圖表來一個：

最大值	100614
最小值	99452
差值	1162

總結：如果是業務限制，UUID還能能用的，如果是新項目，能避免還是避免吧。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Sharding-JDBC源碼解析與vivo的定製開發

作者：vivo IT 平臺團隊 - Xiong Huanxin Sharding-JDBC是在JDBC層提供服務的數據庫中間件，在分庫分表場景具有廣泛應用。本文對Sharding-JDBC的解析、路由、改寫、執行、

2024-03-08 12:31:43

如何解決多租戶數據庫連接過大的問題？

參考 https://my.oschina.net/u/4090830/blog/10087908 分庫分表方案： ① 單 mysql 實例不分庫只分表：因爲分庫，一個程序啓動時需要創建多個數據源，而每個數據源都需要一個連接池，導致總連接

2023-07-12 22:59:22

分佈式數據庫 Join 查詢設計與實現淺析 | 京東雲技術團隊

相對於單例數據庫的查詢操作，分佈式數據查詢會有很多技術難題。本文記錄 Mysql 分庫分表和 Elasticsearch Join 查詢的實現思路，瞭解分佈式場景數據處理的設計方案。文章從常用的關係型數據庫 MySQL 的分庫分表J

2023-06-09 11:50:38

踩坑sharding jdbc，集成多數據源-轉載自知乎

最近有個項目的幾張表，數量級在千萬以上，技術棧是SpringBoot+Mybatis-plus+MySQL。如果使用單表，在進行查詢操作，非常耗時，經過一番調研，決定使用分表中間件：ShardingSphere。 ShardingSpher

2021-12-26 21:32:33

數據庫篇 - 如何做好主從分離？

如果你做過稍大型電商項目的話，就知道電商項目在像雙11，雙12這種場景的需要考慮的併發場景與數據庫交互過程有多重要，如果能保證當查詢請求數劇增的情況下，web端能正常運行，依據一些雲廠商的 Benchmark 的結果，在 4 核 8G 的機

2021-12-25 21:36:54

客戶端分片到Proxy分片，如絲般順滑的平穩遷移

點擊上方藍色字體，選擇“設爲星標” 回覆”學習資料“獲取學習寶典背景隨着訂單數量的增多，以及大促時需要扛住比平時多N倍的流量，單庫單表的瓶頸日益顯現。需要對數據庫進行水平拆分，目前訂單使用的是客戶端分片的

2021-08-25 21:39:50

mysql分庫分表實踐

分庫分表實踐 1. 爲什麼要分庫分表？在日常開發中，mysql中的表有大有小，通常msyql開發手冊會提示我們每張表不易存放太多數據，否則會造成單表IO劇增，導致併發量急劇下降，至於大表的查詢性能會降低到什麼程度，大家沒有一個明顯的認知，

2021-05-26 21:09:04

MySQL讀寫分離，寫完讀不到問題如何解決

點擊上方"程序員歷小冰"，選擇“置頂或者星標” 你的關注意義重大! 大家好，我是歷小冰。今天我們來詳細瞭解一下主從同步延遲時讀寫分離發生寫後讀不到的問題，依次講解問題出現的原因，解決策略以及 Sharding-jdbc、MyCat

2021-03-22 21:31:21

分庫分表的方案

大數據量系統開發中，由於數據量很大，經常遇到數據存儲在集羣上的需求，這時候就需要在不同的方案中進行權衡選擇了。一種選擇是利用現成的中間件，比如ES，HBASE，mongdb等，這些中間件自帶集羣擴展功能，業務代碼無需關注水平擴展。還有一

2021-02-18 21:28:36

專訪京東科技張亮：本土開源需形成吸納開發者的靶心

伴隨着開源產業的蓬勃發展，開源技術成爲助力產業數智化變革的關鍵力量，開源企業更是受到資本的青睞。據不完全統計，僅在過去一年，國內先後有超過10家開源企業獲得新一輪融資，融資紀錄爲近年來開源賽道最高。與此同時，大公司開源步伐加速、國內第一家開

2021-02-01 21:16:21

ShardingSphere 實戰

目錄一、項目介紹 1.1、shardingSphere介紹 1.2、sharding-JDBC、sharding-Proxy 1.3、sharding-JDBC、sharding-Proxy和Sharding-SideCar 區別 1

2021-01-30 10:48:57

數據量大怎麼搞？當然是用這個了！

作者：伍陸七 juejin.cn/post/6844904182365814797 最近項目中不少表的數據量越來越大，並且導致了一些數據庫的性能問題。因此想借助一些分庫分表的中間件，實現自動化分庫分表實現。調研下來，發現Shardin

2021-01-30 10:17:50

ShardingSphere學習：04-ShardingSphere中的配置體系是如何設計的？

什麼是行表達式？行表達式是 ShardingSphere 中用於實現簡化和統一配置信息的一種工具，在日常開發過程中應用得非常廣泛。它的使用方式非常直觀，只需要在配置中使用 ${expression} 或 $->{expression}

2021-01-30 10:11:56

網站性能調優實戰-學相伴KuangStudy

面對併發我們是如何優化KuangStudy網站性能的？每個項目都會隨着用戶和數據的增長調整架構，來面對未來的問題，我們也不例外，在1月5號我們平臺正式公測後，引起了很多觀衆的熱烈反響，僅僅4天，註冊用戶便破萬。隨之而來的就是平臺開始變

2021-01-30 09:58:39

Mybatis 一二級緩存實現原理與使用指南

Mybatis 與 Hibernate 一樣，支持一二級緩存。一級緩存指的是 Session 級別的緩存，即在一個會話中多次執行同一條 SQL 語句並且參數相同，則後面的查詢將不會發送到數據庫，直接從 Session 緩存中獲取。二級緩存

2021-01-30 09:46:21

24小時熱門文章

最新文章

最新評論文章