《阿里巴巴 Java 開發手冊》第五章MySQL數據庫解讀(1)

我的公衆號《駭客與畫家》

基於手冊最新版本《阿里巴巴 Java 開發手冊(華山版)》

《阿里巴巴 Java 開發手冊》下載地址: https://github.com/alibaba/p3c

參考文章:

點評阿里JAVA手冊之MySQL數據庫

詳細解讀阿里手冊之MySQL

開發不規範,親人兩行淚 🤣

(一) 建表規約

1.強制】表達是與否概念的字段,必須使用 is_xxx 的方式命名,數據類型是 unsigned tinyint( 1 表示是,0 表示否)。

說明:任何字段如果爲非負數,必須是 unsigned。

注意:POJO 類中的任何布爾類型的變量,都不要加 is 前綴,所以,需要在 設置從 is_xxx 的映射關係。數據庫表示是與否的值,使用 tinyint 類型,堅持 is_xxx 的命名方式是爲了明確其取值含義與取值範圍。

正例:表達邏輯刪除的字段名 is_deleted,1 表示刪除,0 表示未刪除。

unsigned 屬性就是將數字類型無符號化

”POJO 類中的任何布爾類型的變量,都不要加 is 前綴“,這個可以參考 Hollis 大佬的這篇文章 爲什麼阿里巴巴禁止開發人員使用isSuccess作爲變量名

2.強制】表名、字段名必須使用小寫字母或數字,禁止出現數字開頭,禁止兩個下劃線中間只出現數字。數據庫字段名的修改代價很大,因爲無法進行預發佈,所以字段名稱需要慎重考慮。

說明:MySQL 在 Windows 下不區分大小寫,但在 Linux 下默認是區分大小寫。因此,數據庫名、表名、字段名,都不允許出現任何大寫字母,避免節外生枝。

正例:aliyun_admin,rdc_config,level3_name

反例:AliyunAdmin,rdcConfig,level_3_name

表名、字段名一定要規範,並且要見名知意。因爲一旦使用之後,想要修改的話會比較麻煩。起一個好的名字真的很重要,能夠在無形中減少溝通成本。

3.強制】表名不使用複數名詞。

說明:表名應該僅僅表示表裏面的實體內容,不應該表示實體數量,對應於 DO 類名也是單數形式,符合表達習慣。

有些單詞的複數形式可能是非常規的,或者就沒有複數形式,因此單數形式更簡單

4.強制】禁用保留字,如 desc、range、match、delayed 等,請參考 MySQL 官方保留字。

文檔地址: https://dev.mysql.com/doc/refman/8.0/en/keywords.html

5.強制】主鍵索引名爲 pk_字段名;唯一索引名爲 uk_字段名;普通索引名則爲 idx_字段名。

說明:pk_ 即 primary key;uk_ 即 unique key;idx_ 即 index 的簡稱。

這樣見名知意,通過前綴就可以知道是什麼類型的索引

6.強制】小數類型爲 decimal,禁止使用 float 和 double。

說明:float 和 double 在存儲的時候,存在精度損失的問題,很可能在值的比較時,得到不正確的結果。如果存儲的數據範圍超過 decimal 的範圍,建議將數據拆成整數和小數分開存儲。

對於和錢相關的系統,精度損失是會造成金錢損失的

7.強制】如果存儲的字符串長度幾乎相等,使用 char 定長字符串類型。

CHAR(M)定義的列的長度爲固定的,M取值可以爲0~255之間,當保存CHAR值時,在它們的右邊填充空格以達到指定的長度。當檢索到CHAR值時,尾部的空格被刪除掉。在存儲或檢索過程中不進行大小寫轉換。CHAR存儲定長數據很方便,CHAR字段上的索引效率極高,比如定義char(10),那麼不論你存儲的數據是否達到了10個字節,都要佔去10個字節的空間,不足的自動用空格填充。

VARCHAR(M)定義的列的長度爲可變長字符串,M取值可以爲0~65535之間,(VARCHAR的最大有效長度由最大行大小和使用的字符集確定。整體最大長度是65,532字節)。VARCHAR值保存時只保存需要的字符數,另加一個字節來記錄長度(如果列聲明的長度超過255,則使用兩個字節)。VARCHAR值保存時不進行填充。當值保存和檢索時尾部的空格仍保留,符合標準SQL。varchar存儲變長數據,但存儲效率沒有CHAR高。如果一個字段可能的值是不固定長度的,我們只知道它不可能超過10個字符,把它定義爲 VARCHAR(10)是最合算的。VARCHAR類型的實際長度是它的值的實際長度+1。爲什麼"+1"呢?這一個字節用於保存實際使用了多大的長度。從空間上考慮,用varchar合適;從效率上考慮,用char合適,關鍵是根據實際情況找到權衡點。

來自: https://blog.csdn.net/qq_24549805/article/details/53426668

8.強制】varchar 是可變長字符串,不預先分配存儲空間,長度不要超過 5000,如果存儲長度大於 5000,定義字段類型爲 text,獨立出來一張表,用主鍵來對應,避免影響其它字段索引效率。

MySQL中char、varchar和text的區別

它們的存儲方式和數據的檢索方式都不一樣。
數據的檢索效率是:char > varchar > text
空間佔用方面,就要具體情況具體分析了。

1.char: 存儲定長數據很方便,CHAR字段上的索引效率極高,必須在括號裏定義長度,可以有默認值,比如定義char(10),那麼不論你存儲的數據是否達到了10個字符,都要佔去10個字符的空間(自動用空格填充),且在檢索的時候後面的空格會隱藏掉,所以檢索出來的數據需要記得用什麼trim之類的函數去過濾空格。

2.varchar: 存儲變長數據,但存儲效率沒有CHAR高,必須在括號裏定義長度,可以有默認值。保存數據的時候,不進行空格自動填充,而且如果數據存在空格時,當值保存和檢索時尾部的空格仍會保留。另外,varchar類型的實際長度是它的值的實際長度+1,這一個字節用於保存實際使用了多大的長度。

3.text: 存儲可變長度的非Unicode數據,最大長度爲2^31-1個字符。text列不能有默認值,存儲或檢索過程中,不存在大小寫轉換,後面如果指定長度,不會報錯誤,但是這個長度是不起作用的,意思就是你插入數據的時候,超過你指定的長度還是可以正常插入。

來自: https://www.jianshu.com/p/cc2d99559532

9.強制】表必備三字段:id, create_time, update_time。

說明:其中 id 必爲主鍵,類型爲 bigint unsigned、單表時自增、步長爲 1。create_time, update_time 的類型均爲 datetime 類型。

create_time 爲一行記錄的創建時間,update_time 爲一行記錄的更新時間

datetime、timestamp精確度都是秒,datetime與時區無關,存儲的範圍廣(1001-9999),timestamp與時區有關,存儲的範圍小(1970-2038)。

10.推薦】表的命名最好是遵循 “業務名稱_表的作用”。

正例:alipay_task / force_project / trade_config

方便區分和查找

11.推薦】庫名與應用名稱儘量一致。

比如你有個項目名稱叫做 alipay-adapter ,那數據庫名可以起名爲 alipay_adapter

12.推薦】如果修改字段含義或對字段表示的狀態追加時,需要及時更新字段註釋。

字段註釋要及時更新,降低溝通成本

13.推薦】字段允許適當冗餘,以提高查詢性能,但必須考慮數據一致。冗餘字段應遵循:

​ 1)不是頻繁修改的字段。

​ 2)不是 varchar 超長字段,更不能是 text 字段。

​ 3) 不是唯一索引的字段。

正例:商品類目名稱使用頻率高,字段長度短,名稱基本一成不變,可在相關聯的表中冗餘存儲類目名稱,避免關聯查詢。

數據庫三範式可以不用嚴格遵循,有時候適當的冗餘能夠提高查詢效率

14.推薦】單錶行數超過 500 萬行或者單表容量超過 2GB,才推薦進行分庫分表。

說明:如果預計三年後的數據量根本達不到這個級別,請不要在創建表時就分庫分表。

15.參考】合適的字符存儲長度,不但節約數據庫表空間、節約索引存儲,更重要的是提升檢索速度。

正例:如下表,其中無符號值可以避免誤存負數,且擴大了表示範圍。

對象 年齡區間 類型 字節 表示範圍
150 歲之內 tinyint unsigned 1 無符號值:0 到 255
數百歲 smallint unsigned 2 無符號值:0 到 65535
恐龍化石 數千萬年 int unsigned 4 無符號值:0 到約 42.9 億
太陽 約 50 億年 bigint unsigned 8 無符號值:0 到約 10 的 19 次方
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章