MySQL生產庫開發規範

原創作品，允許轉載，轉載時請務必以超鏈接形式標明文章原始出處、作者信息和本聲明。否則將追究法律責任。http://suifu.blog.51cto.com/9167728/1792604

MySQL開發規範

文件狀態：
[ ] 草稿
[√] 正式發佈
[ ] 正在修改文件標識：
當前版本： V1.0
作者：賀磊
完成日期： 2016-05-24

變更記錄
序號修改日期修改內容修改人審覈人批准人批准日期
1 2016-05-24 MySQL開發規範賀磊

MySQL開發規範
1. 簡介
持續借鑑、收集並整理一些開發規範和技巧，期望能更充分利用MySQL的特性，得到更好的性能。
規範是死的，人是活的。
現在定義的規範，是爲以後推翻準備的。
1.1 目的
提供給開發人員參考，方便寫成更有效率的開發。
1.2 範圍
文檔涉及的範圍：需要基於MySQL做應用開發的人員。
1.3 定義、首字母縮寫詞和縮略語
暫無

2. 數據庫設計
目標三個：功能實現，可伸縮性，可用性。
關鍵點：平衡業務技術各個方面，做好取捨。
80%的性能優化來自架構設計的優化。
2.1 引擎及版本選擇
******引擎建議使用InnoDB
根據目前我們業務的特點，建議使用MySQL5.6社區版。
2.2 架構淺談
開發大牛都擅長，這裏不多提，僅標註一下。
2.2.1 讀寫分離
2.2.2 分庫分表

3. 表設計
先看一個範例：

create
table erp_example(
id int(10) unsigned NOT NULL AUTO_INCREMENT,/**每個表都要有主鍵id， int無符號自增，且與業務無關。**/
server_type TINYINT(3) UNSIGNED NOT NULL DEFAULT 0,/**如果存儲類型，例如1：北京，2：上海，3:廣州，若無負數則用unsigned可以提高範圍。若無需字母，不要用char(1)來存**/
name varchar(5) NOT NULL DEFAULT '',/**varchar,char根據實際需要賦值，越小越好，且能用NOT NULL DEFAULT ''就用，NULL不但佔據空間，且會降低索引效率，用''空字符串代替。**/
PRIMARY
KEY(id),
KEY `idx_name` (`name`)/**索引用idx_列名來標記，唯一索引用uniq_列名來標記**/
)
ENGINE=innodb
AUTO_INCREMENT=1
DEFAULT
CHARSET=utf8;

3.1 設計規範
3.1.1 每張表都要有主鍵id int(10) UNSIGNED ，且與業務無關。 NOT NULL AUTO_INCREMENT 。
3.1.2 建議字段定義爲NOT NULL,需爲空字段可定義爲NOT NULL DEFAULT ''或0(0不要賦予實際意義)。
3.1.3 庫名、表名、字段名必須使用小寫字母，“_”分割。
3.1.4 庫名、表名、字段名不超過12個字符。
3.1.5 庫名、表名、字段名見名知意,建議使用名詞而不是動詞。
3.1.6 存儲精確浮點數必須使用DECIMAL替代FLOAT和DOUBLE。
3.1.7 建議使用UNSIGNED存儲非負數值。
3.1.8 建議使用INT UNSIGNED存儲IPV4。
3.1.9 整形定義中建議採用INT(10),而不是INT(1),INT(11)或其他。
3.1.10 存儲狀態，性別等，用TINYINT，如果不需要負數加UNSIGNED。使用TINYINT UNSIGNED。
3.1.11 不建議使用ENUM類型，使用TINYINT來代替。
3.1.12 儘可能不使用TEXT、BLOB類型。
3.1.13 VARCHAR(N)，N表示的是字符數不是字節數，比如VARCHAR(255)，可以最大可存儲255個漢字，需要根據實際的寬度來選擇N。VARCHAR(N)，N儘可能小，因爲MySQL一個表中所有的VARCHAR字段最大長度是65535個字節21845個漢字，進行排序和創建臨時表一類的內存操作時，會使用N的長度申請內存。
3.1.14 表字符集選擇UTF8。
3.1.15 存儲年使用YEAR類型。
3.1.16 存儲日期使用DATE類型。
3.1.17 存儲時間（精確到秒）建議使用TIMESTAMP類型，因爲TIMESTAMP使用4字節，DATETIME使用8個字節。TIMESTAMP類型保存的值不能比1970早或比2037晚。
3.1.18 將過大字段拆分到其他表中。
3.1.19 禁止在數據庫中使用VARBINARY、BLOB存儲圖片、文件等。
3.1.20 表結構變更需要通知DBA審覈。

一句話總結：能NOT NULL 就NOT NULL，char、varchar用NOT NULL DEFAULT '',tinyint、smallint、int用NOT NULL DEFAULT 0。char、varchar取值要吝嗇，根據實際需求給，比如人名一般不超過5個，varchar(5)，不要varchar(200)。int、tinyint這類，int(1)和int(13)都是一樣的，我們統一用int(10),tinyint取值範圍[-128,127],加了unsigned取值[0,255]，如果不需要存儲負數，整型類型的加unsigned。

3.2 索引
3.2.1 非唯一索引必須按照“idx_字段名稱_字段名稱[_字段名]”進行命名。
3.2.2 唯一索引必須按照“uniq_字段名稱_字段名稱[_字段名]”進行命名。
3.2.3 索引名稱必須使用小寫。
3.2.4 索引中的字段數建議不超過5個。
3.2.5 單張表的索引數量控制在5個以內。
3.2.6 索引字段的順序需要考慮字段值去重之後的個數，個數多的放在前面。
3.2.7 使用EXPLAIN判斷SQL語句是否合理使用索引，儘量避免extra列出現：Using File Sort，UsingTemporary。
3.2.8 UPDATE、DELETE語句需要根據WHERE條件添加索引。
3.2.9 不建議使用%前綴模糊查詢，例如LIKE “%weibo”。
3.2.10 合理創建聯合索引（避免冗餘），(a,b,c) 相當於 (a) 、(a,b) 、(a,b,c)，但（a,c）只能用到部分索引。
3.2.11 合理利用覆蓋索引。
3.2.12 SQL變更需要確認索引是否需要變更並通知DBA。

3.3 SQL語句
3.3.1 SQL語句中IN包含的值不應過多。
3.3.2 UPDATE、DELETE語句不使用LIMIT。
3.3.3 WHERE條件中必須使用合適的類型，避免MySQL進行隱式類型轉化。
3.3.4 SELECT語句只獲取需要的字段。
3.3.5 SELECT、INSERT語句必須顯式的指明字段名稱，不使用SELECT *，不使用INSERT INTO table()。
3.3.6 使用SELECT column_name1, column_name2 FROM table WHERE[condition]而不是SELECT column_name1 FROM table WHERE[condition]和SELECT column_name2 FROM table WHERE [condition]。
3.3.7 WHERE條件中的非等值條件（IN、BETWEEN、<、<=、>、>=）會導致後面的條件使用不了索引。
3.3.8 避免在SQL語句進行數學運算或者函數運算，容易將業務邏輯和DB耦合在一起。
3.3.9 INSERT語句使用batch提交（INSERT INTO table VALUES(),(),()……），values的個數不應過多。
3.3.10 避免使用存儲過程、觸發器、函數等，容易將業務邏輯和DB耦合在一起，並且MySQL的存儲過程、觸發器、函數中存在一定的bug。
3.3.11 避免使用JOIN。
3.3.12 使用合理的SQL語句減少與數據庫的交互次數。
3.3.13 不使用ORDER BY RAND()，使用其他方法替換。
3.3.14 建議使用合理的分頁方式以提高分頁的效率。
3.3.15 統計表中記錄數時使用COUNT(*)，而不是COUNT(primary_key)和COUNT(1)。

3.4 分表
3.4.1 每張表數據量建議控制在500w以下。
3.4.2 使用時間分表，表名後綴必須使用特定格式，比如按年分表user_2016按月分表user_201602、按日分表user_20160209。

4. FAQ
4.1 庫名、表名、字段名使用小寫字母，“_”分割。
a)MySQL有配置參數lower_case_table_names，不可動態更改，linux系統默認爲0，即庫表名以實際情況存儲，大小寫敏感。如果是1，以小寫存儲，大小寫不敏感。如果是2，以實際情況存儲，但以小寫比較。
b) 如果大小寫混合用，可能存在abc,Abc,ABC等多個表共存，容易導致混亂。
c) 字段名顯示區分大小寫，但實際使用不區分，即不可以建立兩個名字一樣但大小寫不一樣的字段。
d) 爲了統一規範，庫名、表名、字段名使用小寫字母。

4.2 庫名、表名、字段名必須不超過12個字符。
庫名、表名、字段名支持最多64個字符，但爲了統一規範、易於辨識以及減少傳輸量，必須不超過12字符。

4.3 庫名、表名、字段名見名知意,建議使用名詞而不是動詞。
a) 用戶評論可用表名usercomment或者comment。
b) 庫表是一種客觀存在的事物，一種對象，所以建議使用名詞。

4.4 建議使用InnoDB存儲引擎。
a) 5.5以後的默認引擘，支持事務，行級鎖，更好的恢復性，高併發下性能更好，對多核，大內存，ssd等硬件支持更好。
b) 具體比較可見附件的官方白皮書。

4.5 存儲精確浮點數必須使用DECIMAL替代FLOAT和DOUBLE。
a) mysql中的數值類型（不包括整型）：
IEEE754浮點數：float? （單精度）， double? 或real? （雙精度）
定點數： decimal或 numeric
單精度浮點數的有效數字二進制是24位，按十進制來說，是8位；雙精度浮點數的有效數字二進制是53位，按十進制來說，是16 位
一個實數的有效數字超過8位，用單精度浮點數來表示的話，就會產生誤差！同樣，如果一個實數的有效數字超過16位，用雙精度浮點數來表示，也會產生誤差
b)IEEE754標準的計算機浮點數，在內部是用二進制表示的，但在將一個十進制數轉換爲二進制浮點數時，也會造成誤差，原因是不是所有的數都能轉換成有限長度的二進制數。
即一個二進制可以準確轉換成十進制，但一個帶小數的十進制不一定能夠準確地用二進制來表示。

實例：
drop table if exists t;

create table t(value float(10,2));

insert into t values(131072.67),(131072.68);

select value from t;
+-----------+
|value|
+-----------+
| 131072.67 |
| 131072.69 |
+-----------+

4.6 建議使用UNSIGNED存儲非負數值。
同樣的字節數，存儲的數值範圍更大。如tinyint 有符號爲 -128-127，無符號爲0-255

4.7 如何使用INT UNSIGNED存儲ip？
使用INTUNSIGNED而不是char(15)來存儲ipv4地址，通過MySQL函數inet_ntoa和inet_aton來進行轉化。Ipv6地址目前沒有轉化函數，需要使用DECIMAL或者兩個bigINT來存儲。例如：
SELECT INET_ATON('209.207.224.40');
3520061480
SELECT INET_NTOA(3520061480);
209.207.224.40

4.8 INT[M]，M值代表什麼含義？
注意數值類型括號後面的數字只是表示寬度而跟存儲範圍沒有關係，比如INT(3)默認顯示3位，空格補齊，超出時正常顯示，python、java客戶端等不具備這個功能。如果採用INT類型，我們都用INT(10)

4.9 不建議使用ENUM、SET類型，使用TINYINT來代替。
a)ENUM，有三個問題：添加新的值要做DDL，默認值問題(將一個非法值插入ENUM(也就是說，允許的值列之外的字符串)，將插入空字符串以作爲特殊錯誤值)，索引值問題（插入數字實際是插入索引對應的值）
實例：
drop table if exists t;
create table t(sex enum('0','1'));
insert into t values(1);
insert into t values('3');
select * from t;
+------+
| sex |
+------+
| 0 |
| |
+------+
2 rows in set (0.00 sec)

4.10 儘可能不使用TEXT、BLOB類型。
a) 索引排序問題，只能使用max_sort_length的長度或者手工指定ORDER BY SUBSTRING(column,length)的長度來排序
b) Memory引擘不支持text,blog類型，會在磁盤上生成臨時表
c) 可能浪費更多的空間
d) 可能無法使用adaptive hash index
e) 導致使用where沒有索引的語句變慢

4.11 VARCHAR中會產生額外存儲嗎？
VARCHAR(M)，如果M<256時會使用一個字節來存儲長度，如果M>=256則使用兩個字節來存儲長度。

4.12 表字符集選擇UTF8。
a) 使用utf8字符集，如果是漢字，佔3個字節，但ASCII碼字符還是1個字節。
b) 統一，不會有轉換產生亂碼風險
c) 其他地區的用戶（美國、印度、臺灣）無需安裝簡體中文支持，就能正常看您的文字，並且不會出現亂碼
d)ISO-8859-1編碼(latin1)使用了單字節內的所有空間，在支持ISO-8859-1的系統中傳輸和存儲其他任何編碼的字節流都不會被拋棄。即把其他任何編碼的字節流當作ISO-8859-1編碼看待都沒有問題，保存的是原封不動的字節流。

4.13 使用VARBINARY存儲變長字符串。
二進制字節流，不存在編碼問題

4.14 爲什麼建議使用TIMESTAMP來存儲時間而不是DATETIME？
DATETIME和TIMESTAMP都是精確到秒，優先選擇TIMESTAMP，因爲TIMESTAMP只有4個字節，而DATETIME8個字節。同時TIMESTAMP具有自動賦值以及自動更新的特性。
如何使用TIMESTAMP的自動賦值屬性？
a) 將當前時間作爲ts的默認值：ts TIMESTAMP DEFAULTCURRENT_TIMESTAMP。
b)當行更新時，更新ts的值：ts TIMESTAMP DEFAULT 0 ONUPDATE CURRENT_TIMESTAMP。
c) 可以將1和2結合起來：ts TIMESTAMP DEFAULTCURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP。
TIMESTAMP類型保存的值不能比1970早或比2037晚
4.15 建議字段定義爲NOT NULL。
a）如果null字段被索引，需要額外的1字節
b）使索引，索引統計，值的比較變得更復雜
c）可用''，0代替
d）如果是索引字段，一定要定義爲not null
例如：NOT NULL default ''

4.16 禁止在數據庫中使用VARBINARY、BLOB存儲圖片、文件等。
採用分佈式文件系統更高效

4.17 爲什麼MySQL的性能依賴於索引？
MySQL的查詢速度依賴良好的索引設計，因此索引對於高性能至關重要。合理的索引會加快查詢速度（包括UPDATE和DELETE的速度，MySQL會將包含該行的page加載到內存中，然後進行UPDATE或者DELETE操作），不合理的索引會降低速度。
MySQL索引查找類似於新華字典的拼音和部首查找，當拼音和部首索引不存在時，只能通過一頁一頁的翻頁來查找。當MySQL查詢不能使用索引時，MySQL會進行全表掃描，會消耗大量的IO。

4.18 爲什麼一張表中不能存在過多的索引？
InnoDB的secondaryindex使用b+tree來存儲，因此在UPDATE、DELETE、INSERT的時候需要對b+tree進行調整，過多的索引會減慢更新的速度。

4.19 EXPLAIN語句
EXPLAIN語句（在MySQL客戶端中執行）可以獲得MySQL如何執行SELECT語句的信息。通過對SELECT語句執行EXPLAIN，可以知曉MySQL執行該SELECT語句時是否使用了索引、全表掃描、臨時表、排序等信息。儘量避免MySQL進行全表掃描、使用臨時表、排序等。詳見官方文檔。

4.20 不建議使用%前綴模糊查詢，例如LIKE “%weibo”。
會導致全表掃描

4.21 什麼是覆蓋索引？
InnoDB 存儲引擎中，secondaryindex（非主鍵索引）中沒有直接存儲行地址，存儲主鍵值。如果用戶需要查詢secondaryindex中所不包含的數據列時，需要先通過secondaryindex查找到主鍵值，然後再通過主鍵查詢到其他數據列，因此需要查詢兩次。
覆蓋索引的概念就是查詢可以通過在一個索引中完成，覆蓋索引效率會比較高，主鍵查詢是天然的覆蓋索引。
合理的創建索引以及合理的使用查詢語句，當使用到覆蓋索引時可以獲得性能提升。

4.22 UPDATE、DELETE語句不使用LIMIT。
a) 可能導致主從數據不一致
b) 會記錄到錯誤日誌，導致日誌佔用大量空間
4.23 爲什麼需要避免MySQL進行隱式類型轉化？
因爲MySQL進行隱式類型轉化之後，可能會將索引字段類型轉化成=號右邊值的類型，導致使用不到索引，原因和避免在索引字段中使用函數是類似的。

4.24 爲什麼不建議使用SELECT *?
增加很多不必要的消耗（cpu、io、內存、網絡帶寬）；增加了使用覆蓋索引的可能性；當表結構發生改變時，前段也需要更新。
4.25 爲什麼不能使用ORDER BY rand()？
因爲ORDER BYrand()會將數據從磁盤中讀取，進行排序，會消耗大量的IO和CPU，可以在程序中獲取一個rand值，然後通過在從數據庫中獲取對應的值。

4.26 MySQL中如何進行分頁？
假如有類似下面分頁語句：
SELECT * FROM table ORDER BY TIME DESC LIMIT 10000,10;
這種分頁方式會導致大量的io，因爲MySQL使用的是提前讀取策略。
推薦分頁方式：
SELECT * FROM table where id >=(select id from table order by id limit 10000,1)limit 10;
SELECT * FROM table inner JOIN(SELECT id FROM table ORDER BY id LIMIT 10000,10) as t USING(id)

4.27 爲什麼避免使用複雜的SQL？
拒絕使用複雜的SQL，將大的SQL拆分成多條簡單SQL分步執行。原因：簡單的SQL容易使用到MySQL的querycache；減少鎖表時間特別是MyISAM；可以使用多核cpu。

2. InnoDB存儲引擎爲什麼避免使用COUNT(*)?
InnoDB表避免使用COUNT(*)操作，計數統計實時要求較強可以使用memcache或者redis，非實時統計可以使用單獨統計表，定時更新。

本文出自 “歲伏” 博客，請務必保留此出處http://suifu.blog.51cto.com/9167728/1792604

MySQL生產庫開發規範

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

MySQL生產庫開發規範

MySQL 替換部分電話號碼爲000

天兔(Lepus)監控系統快速安裝部署

MySQL利用Navicat導出數據字典

MongoDB安裝環境搭建

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結