58到家數據庫30條軍規解讀

本文轉自58到家數據庫30條軍規解讀
感謝沈劍老師！！！

軍規適用場景：併發量大、數據量大的互聯網業務

必須使用InnoDB存儲引擎
解讀：支持事務、行級鎖、併發性能更好、CPU及內存緩存頁優化使得資源利用率更高
必須使用UTF8字符集
解讀：萬國碼，無需轉碼，無亂碼風險，節省空間
數據表、數據字段必須加入中文註釋
解讀：N年後誰tm知道這個r1,r2,r3字段是幹嘛的
禁止使用存儲過程、視圖、觸發器、Event
解讀：高併發大數據的互聯網業務，架構設計思路是“解放數據庫CPU，將計算轉移到服務層”，併發量大的情況下，這些功能很可能將數據庫拖死，業務邏輯放到服務層具備更好的擴展性，能夠輕易實現“增機器就加性能”。數據庫擅長存儲與索引，CPU計算還是上移吧
禁止存儲大文件或者大照片
解讀：爲何要讓數據庫做它不擅長的事情？大文件和照片存儲在文件系統，數據庫裏存URI多好

單實例表數目必須小於500
單表列數目必須小於30
表必須有主鍵，例如自增主鍵
解讀：
a）主鍵遞增，數據行寫入可以提高插入性能，可以避免page分裂，減少表碎片提升空間和內存的使用
b）主鍵要選擇較短的數據類型， Innodb引擎普通索引都會保存主鍵的值，較短的數據類型可以有效的減少索引的磁盤空間，提高索引的緩存效率
c）無主鍵的表刪除，在row模式的主從架構，會導致備庫夯住
禁止使用外鍵，如果有外鍵完整性約束，需要應用程序控制
解讀：外鍵會導致表與表之間耦合，update與delete操作都會涉及相關聯的表，十分影響sql 的性能，甚至會造成死鎖。高併發情況下容易造成數據庫性能，大數據高併發業務場景數據庫使用以性能優先

必須把字段定義爲NOT NULL並且提供默認值
解讀：
a）null的列使索引/索引統計/值比較都更加複雜，對MySQL來說更難優化
b）null 這種類型MySQL內部需要進行特殊處理，增加數據庫處理記錄的複雜性；同等條件下，表中有較多空字段的時候，數據庫的處理性能會降低很多
c）null值需要更多的存儲空，無論是表還是索引中每行中的null的列都需要額外的空間來標識
d）對null 的處理時候，只能採用is null或is not null，而不能採用=、in、<、<>、!=、not in這些操作符號。如：where name!=’shenjian’，如果存在name爲null值的記錄，查詢結果就不會包含name爲null值的記錄
禁止使用TEXT、BLOB類型
解讀：會浪費更多的磁盤和內存空間，非必要的大量的大字段查詢會淘汰掉熱數據，導致內存命中率急劇降低，影響數據庫性能
禁止使用小數存儲貨幣
解讀：使用整數吧，小數容易導致錢對不上
必須使用varchar(20)存儲手機號
解讀：
a）涉及到區號或者國家代號，可能出現+-()
b）手機號會去做數學運算麼？
c）varchar可以支持模糊查詢，例如：like“138%”
禁止使用ENUM，可使用TINYINT代替
解讀：
a）增加新的ENUM值要做DDL操作
b）ENUM的內部實際存儲就是整數，你以爲自己定義的是字符串？

單表索引建議控制在5個以內
單索引字段數不允許超過5個
解讀：字段超過5個時，實際已經起不到有效過濾數據的作用了
禁止在更新十分頻繁、區分度不高的屬性上建立索引
解讀：
a）更新會變更B+樹，更新頻繁的字段建立索引會大大降低數據庫性能
b）“性別”這種區分度不大的屬性，建立索引是沒有什麼意義的，不能有效過濾數據，性能與全表掃描類似
建立組合索引，必須把區分度高的字段放在前面
解讀：能夠更加有效的過濾數據

禁止使用SELECT *，只獲取必要的字段，需要顯示說明列屬性
解讀：
a）讀取不需要的列會增加CPU、IO、NET消耗
b）不能有效的利用覆蓋索引
c）使用SELECT *容易在增加或者刪除字段後出現程序BUG
禁止使用INSERT INTO t_xxx VALUES(xxx)，必須顯示指定插入的列屬性
解讀：容易在增加或者刪除字段後出現程序BUG
禁止使用屬性隱式轉換
解讀：SELECT uid FROM t_user WHERE phone=13812345678 會導致全表掃描，而不能命中phone索引，猜猜爲什麼？（這個線上問題不止出現過一次）
禁止在WHERE條件的屬性上使用函數或者表達式
解讀：SELECT uid FROM t_user WHERE from_unixtime(day)>=’2017-02-15’ 會導致全表掃描
正確的寫法是：SELECT uid FROM t_user WHERE day>= unix_timestamp(‘2017-02-15 00:00:00’)
禁止負向查詢，以及%開頭的模糊查詢
解讀：
a）負向查詢條件：NOT、!=、<>、!<、!>、NOT IN、NOT LIKE等，會導致全表掃描
b）%開頭的模糊查詢，會導致全表掃描
禁止大表使用JOIN查詢，禁止大表使用子查詢
解讀：會產生臨時表，消耗較多內存與CPU，極大影響數據庫性能
禁止使用OR條件，必須改爲IN查詢
解讀：舊版本Mysql的OR查詢是不能命中索引的，即使能命中索引，爲何要讓數據庫耗費更多的CPU幫助實施查詢優化呢？
應用程序必須捕獲SQL異常，並有相應處理

本文轉自58到家數據庫30條軍規解讀
感謝沈劍老師！！！

發佈了48 篇原創文章 · 獲贊 12 · 訪問量 7萬+