数据库水平拆分之ID生成策略

原創

2021-04-05 09:18

众所周知，数据分片包括水平和垂直，这里只讨论水平这种情况，并且，我们默认数据的切分规则是以ID。

细化下来，其实主要是讨论两种情况：ID为UUID或者说无序的字符串的情况，以及ID是数字形式的情况。前者无序，后者有序。

当ID是无序字符串的时候，一般采用将ID哈希后再取模的形式，而数字则直接取模。从原理上说，前者无法保证数据彻底均匀的分布在各个表中，而后者则没有这种情况。

但，空口无凭，一切还是要以事实为依据，做到心中有数。所以，我创建了10张测试表，准备插入100万条数据，用来探索UUID形式的ID加哈希这种算法的数据分布情况。当然，其实有更简单的方式，直接生成100万个UUID然后哈希取模并计数就行了。不过，我正好测试Sharding JDBC，算是顺势而为吧。

数据如下：

表名	数据量
t0	100032
t1	100315
t2	99452
t3	99762
t4	100001
t5	99791
t6	100614
t7	100373
t8	99796
t9	99864

图表来一个：

最大值	100614
最小值	99452
差值	1162

总结：如果是业务限制，UUID还能能用的，如果是新项目，能避免还是避免吧。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Sharding-JDBC源码解析与vivo的定制开发

作者：vivo IT 平臺團隊 - Xiong Huanxin Sharding-JDBC是在JDBC層提供服務的數據庫中間件，在分庫分表場景具有廣泛應用。本文對Sharding-JDBC的解析、路由、改寫、執行、

2024-03-08 12:31:43

如何解决多租户数据库连接过大的问题？

參考 https://my.oschina.net/u/4090830/blog/10087908 分庫分表方案： ① 單 mysql 實例不分庫只分表：因爲分庫，一個程序啓動時需要創建多個數據源，而每個數據源都需要一個連接池，導致總連接

2023-07-12 22:59:22

分布式数据库 Join 查询设计与实现浅析 | 京东云技术团队

相對於單例數據庫的查詢操作，分佈式數據查詢會有很多技術難題。本文記錄 Mysql 分庫分表和 Elasticsearch Join 查詢的實現思路，瞭解分佈式場景數據處理的設計方案。文章從常用的關係型數據庫 MySQL 的分庫分表J

2023-06-09 11:50:38

踩坑sharding jdbc，集成多数据源-转载自知乎

最近有個項目的幾張表，數量級在千萬以上，技術棧是SpringBoot+Mybatis-plus+MySQL。如果使用單表，在進行查詢操作，非常耗時，經過一番調研，決定使用分表中間件：ShardingSphere。 ShardingSpher

2021-12-26 21:32:33

数据库篇 - 如何做好主从分离？

如果你做過稍大型電商項目的話，就知道電商項目在像雙11，雙12這種場景的需要考慮的併發場景與數據庫交互過程有多重要，如果能保證當查詢請求數劇增的情況下，web端能正常運行，依據一些雲廠商的 Benchmark 的結果，在 4 核 8G 的機

2021-12-25 21:36:54

客户端分片到Proxy分片，如丝般顺滑的平稳迁移

點擊上方藍色字體，選擇“設爲星標” 回覆”學習資料“獲取學習寶典背景隨着訂單數量的增多，以及大促時需要扛住比平時多N倍的流量，單庫單表的瓶頸日益顯現。需要對數據庫進行水平拆分，目前訂單使用的是客戶端分片的

2021-08-25 21:39:50

mysql分库分表实践

分庫分表實踐 1. 爲什麼要分庫分表？在日常開發中，mysql中的表有大有小，通常msyql開發手冊會提示我們每張表不易存放太多數據，否則會造成單表IO劇增，導致併發量急劇下降，至於大表的查詢性能會降低到什麼程度，大家沒有一個明顯的認知，

2021-05-26 21:09:04

MySQL读写分离，写完读不到问题如何解决

點擊上方"程序員歷小冰"，選擇“置頂或者星標” 你的關注意義重大! 大家好，我是歷小冰。今天我們來詳細瞭解一下主從同步延遲時讀寫分離發生寫後讀不到的問題，依次講解問題出現的原因，解決策略以及 Sharding-jdbc、MyCat

2021-03-22 21:31:21

分库分表的方案

大數據量系統開發中，由於數據量很大，經常遇到數據存儲在集羣上的需求，這時候就需要在不同的方案中進行權衡選擇了。一種選擇是利用現成的中間件，比如ES，HBASE，mongdb等，這些中間件自帶集羣擴展功能，業務代碼無需關注水平擴展。還有一

2021-02-18 21:28:36

专访京东科技张亮：本土开源需形成吸纳开发者的靶心

伴隨着開源產業的蓬勃發展，開源技術成爲助力產業數智化變革的關鍵力量，開源企業更是受到資本的青睞。據不完全統計，僅在過去一年，國內先後有超過10家開源企業獲得新一輪融資，融資紀錄爲近年來開源賽道最高。與此同時，大公司開源步伐加速、國內第一家開

2021-02-01 21:16:21

ShardingSphere 实战

目錄一、項目介紹 1.1、shardingSphere介紹 1.2、sharding-JDBC、sharding-Proxy 1.3、sharding-JDBC、sharding-Proxy和Sharding-SideCar 區別 1

2021-01-30 10:48:57

数据量大怎么搞？当然是用这个了！

作者：伍陸七 juejin.cn/post/6844904182365814797 最近項目中不少表的數據量越來越大，並且導致了一些數據庫的性能問題。因此想借助一些分庫分表的中間件，實現自動化分庫分表實現。調研下來，發現Shardin

2021-01-30 10:17:50

ShardingSphere学习：04-ShardingSphere中的配置体系是如何设计的？

什麼是行表達式？行表達式是 ShardingSphere 中用於實現簡化和統一配置信息的一種工具，在日常開發過程中應用得非常廣泛。它的使用方式非常直觀，只需要在配置中使用 ${expression} 或 $->{expression}

2021-01-30 10:11:56

网站性能调优实战-学相伴KuangStudy

面對併發我們是如何優化KuangStudy網站性能的？每個項目都會隨着用戶和數據的增長調整架構，來面對未來的問題，我們也不例外，在1月5號我們平臺正式公測後，引起了很多觀衆的熱烈反響，僅僅4天，註冊用戶便破萬。隨之而來的就是平臺開始變

2021-01-30 09:58:39

Mybatis 一二级缓存实现原理与使用指南

Mybatis 與 Hibernate 一樣，支持一二級緩存。一級緩存指的是 Session 級別的緩存，即在一個會話中多次執行同一條 SQL 語句並且參數相同，則後面的查詢將不會發送到數據庫，直接從 Session 緩存中獲取。二級緩存

2021-01-30 09:46:21

24小時熱門文章

最新文章

最新評論文章