MyISAM和InnoDB的區別
- MySQL默認採用的是MyISAM。
- MyISAM不支持事務,而InnoDB支持( 提供了具有事務(commit)、回滾(rollback)和崩潰修復能力(crash
recovery capabilities)的事務安全(transaction-safe (ACID compliant))型表)。InnoDB的AUTOCOMMIT默認是打開的,即每條SQL語句會默認被封裝成一個事務,自動提交,會影響速度,所以最好是把多條SQL語句顯示放在begin和commit之間,組成一個事務去提交。
- InnoDB支持數據行鎖定,MyISAM不支持行鎖定,只支持鎖定整個表。即MyISAM同一個表上的讀鎖和寫鎖是互斥的,MyISAM併發讀寫時如果等待隊列中既有讀請求又有寫請求,默認寫請求的優先級高,即使讀請求先到,所以MyISAM不適合於有大量查詢和修改並存的情況,那樣查詢進程會長時間阻塞。因爲MyISAM是鎖表,所以某項讀操作比較耗時會使其他寫進程餓死。
- InnoDB支持外鍵,MyISAM不支持。
- InnoDB的主鍵範圍更大,最大是MyISAM的2倍。
- InnoDB不支持全文索引,而MyISAM支持。全文索引是指對char、varchar和text中的每個詞(停用詞除外)建立倒排序索引。MyISAM的全文索引其實沒啥用,因爲它不支持中文分詞,必須由使用者分詞後加入空格再寫到數據表裏,而且少於4個漢字的詞會和停用詞一樣被忽略掉。
- MyISAM支持GIS數據,InnoDB不支持。即MyISAM支持以下空間數據對象:Point,Line,Polygon,Surface等。
- 沒有where的count(*)使用MyISAM要比InnoDB快得多。因爲MyISAM內置了一個計數器,count(*)時它直接從計數器中讀,而InnoDB必須掃描全表。所以在InnoDB上執行count(*)時一般要伴隨where,且where中要包含主鍵以外的索引列。爲什麼這裏特別強調“主鍵以外”?因爲InnoDB中primary
index是和raw data存放在一起的,而secondary index則是單獨存放,然後有個指針指向primary key。所以只是count(*)的話使用secondary index掃描更快,而primary key則主要在掃描索引同時要返回raw data時的作用較大。
索引的類型
聚簇索引:clustered index 其實數據存儲結構,索引和記錄(全部)內容保存同一個結構中。“聚簇”就是索引和記錄緊密在一起,分開就不是聚簇索引了,所以一張表只能有唯一的聚簇索引。
非聚簇索引:secondary index ,葉子節點保存了主鍵值,要定位記錄還要再查一遍聚簇索引。
覆蓋索引:覆蓋索引是指索引的葉子節點已包含所有要查詢的列,因此不需要訪問表數據(回表~~有學個名詞,查詢聚簇索引)
聚簇索引與非聚簇索引的區別
對於聚簇索引存儲來說,行數據和主鍵B+樹存儲在一起,輔助鍵B+樹只存儲輔助鍵和主鍵,主鍵和非主鍵B+樹幾乎是兩種類型的樹。
對非聚簇索引存儲來說,主鍵B+樹在葉子節點存儲指向真正數據行的指針,而非主鍵。
查找時能不能直接定位:聚簇索引的葉節點就是數據節點,而非聚簇索引的頁節點仍然是索引檢點,並保留一個鏈接指向對應數據塊。
物理排序:聚簇索引對數據進行物理的排序,非聚簇索引不對數據進行物理排序
InnoDB使用的是聚簇索引,
將主鍵組織到一棵B+樹中,而行數據就儲存在葉子節點上,若使用"where id = 14"這樣的條件查找主鍵,則按照B+樹的檢索算法即可查找到對應的葉節點,
之後獲得行數據。若對Name列進行條件搜索,則需要兩個步驟:第一步在輔助索引B+樹中檢索Name,到達其葉子節點獲取對應的主鍵。
第二步使用主鍵在主索引B+樹種再執行一次B+樹檢索操作,最終到達葉子節點即可獲取整行數據。
MyISM使用的是非聚簇索引,
非聚簇索引的兩棵B+樹看上去沒什麼不同,節點的結構完全一致只是存儲的內容不同而已,主鍵索引B+樹的節點存儲了主鍵,輔助鍵索引B+樹存儲了輔助鍵。表數據存儲在獨立的地方,這兩顆B+樹的葉子節點都使用一個地址指向真正的表數據,對於表數據來說,這兩個鍵沒有任何差別。由於索引樹是獨立的,通過輔助鍵檢索無需訪問主鍵的索引樹。
爲了更形象說明這兩種索引的區別,我們假想一個表如下圖存儲了4行數據。其中Id作爲主索引,Name作爲輔助索引。圖示清晰的顯示了聚簇索引和非聚簇索引的差異。
鎖表的情況
用索引字段做爲條件進行修改時, 是否表鎖的取決於這個索引字段能否確定記錄唯一,當索引值對應記錄不唯一,會進行鎖表,相反則行鎖。
同一個表,如果進行刪除操作時,儘量讓刪除條件統一,否則會相互影響造成鎖表
解決
mysql>show
processlist;
mysql>kill
thread_id;
相關參數
my.ini(Linux系統下是my.cnf),當mysql服務器啓動時它會讀取這個文件,設置相關的運行環境參數。
my.ini分爲兩塊:Client Section和Server Section。
Client Section用來配置MySQL客戶端參數。
要查看配置參數可以用下面的命令:show variables like'%innodb%';
# 查看innodb相關配置參數
show status like'%innodb%'; # 查看innodb相關的運行時參數(比如當前正在打開的表的數量,當前已經打開的表的數量)
show global status like'open%tables'; # 查看全局的運行時參數,加上global是對當前mysql服務器中運行的所有數據庫實例進行統計。不加global則只對當前數據庫實例進行統計。
1、Client Section
[client]
port = 3306 # 設置mysql客戶端連接服務端時默認使用的端口
[mysql]
default-character-set=utf8 # 設置mysql客戶端默認字符集
2、Server Section
[mysqld]
port=3306 #
mysql服務端默認監聽(listen on)的TCP/IP端口
basedir="C:/Program Files/MySQL/MySQL Server 5.5/" # 基準路徑,其他路徑都相對於這個路徑
datadir="C:/Program Files/MySQL/MySQL Server 5.5/Data" # mysql數據庫文件所在目錄
character-set-server=latin1 # 服務端使用的字符集默認爲8比特編碼的latin1字符集
default-storage-engine=INNODB # 創建新表時將使用的默認存儲引擎
sql-mode="STRICT_TRANS_TABLES,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION" # SQL模式爲strict模式
max_connections=100 # mysql服務器支持的最大併發連接數。但總會預留其中的一個連接給管理員使用超級權限登錄,如果設置得過小而用戶比較多,會經常出現“Too many connections”錯誤。
query_cache_size=0 # 查詢緩存大小,用於緩存SELECT查詢結果。如果有許多返回相同查詢結果的SELECT查詢,並且很少改變表,可以設置query_cache_size大於0,可以極大改善查詢效率。而如果表數據頻繁變化,就不要使用這個,會適得其反
table_cache=256 # 這個參數在5.1.3之後的版本中叫做table_open_cache,用於設置table高速緩存的數量。由於每個客戶端連接都會至少訪問一個表,因此此參數的值與 max_connections有關。當某一連接訪問一個表時,MySQL會檢查當前已緩存表的數量。如果該表已經在緩存中打開,則會直接訪問緩存中的表已加快查詢速度;如果該表未被緩存,則會將當前的表添加進緩存並進行查詢。在執行緩存操作之前,table_cache用於限制緩存表的最大數目:如果當前已經緩存的表未達到table_cache,則會將新表添加進來;若已經達到此值,MySQL將根據緩存表的最後查詢時間、查詢率等規則釋放之前的緩存。
tmp_table_size=34M # 內存中的每個臨時表允許的最大大小。如果臨時表大小超過該值,臨時表將自動轉爲基於磁盤的表(Disk Based Table)。
thread_cache_size=8 # 緩存的最大線程數。當客戶端連接斷開時,如果客戶端總連接數小於該值,則處理客戶端任務的線程放回緩存。在高併發情況下,如果該值設置得太小,就會有很多線程頻繁創建,線程創建的開銷會變大,查詢效率也會下降。一般來說如果在應用端有良好的多線程處理,這個參數對性能不會有太大的提高。
# MyISAM相關參數
myisam_max_sort_file_size=100G # mysql重建索引時允許使用的臨時文件最大大小
myisam_sort_buffer_size=68M
key_buffer_size=54M # Key Buffer大小,用於緩存MyISAM表的索引塊。決定數據庫索引處理的速度(尤其是索引讀)
read_buffer_size=64K # 用於對MyISAM表全表掃描時使用的緩衝區大小。針對每個線程進行分配(前提是進行了全表掃描)。進行排序查詢時,MySql會首先掃描一遍該緩衝,以避免磁盤搜索,提高查詢速度,如果需要排序大量數據,可適當調高該值。但MySql會爲每個客戶連接發放該緩衝空間,所以應儘量適當設置該值,以避免內存開銷過大。
read_rnd_buffer_size=256K
sort_buffer_size=256K # connection級參數(爲每個線程配置),500個線程將消耗500*256K的sort_buffer_size。
# InnoDB相關參數
innodb_additional_mem_pool_size=3M # InnoDB用於存儲元數據信息的內存池大小,一般不需修改
innodb_flush_log_at_trx_commit =1 # 事務相關參數,如果值爲1,則InnoDB在每次commit都會將事務日誌寫入磁盤(磁盤IO消耗較大),這樣保證了完全的ACID特性。而如果設置爲0,則表示事務日誌
寫入內存log和內存log寫入磁盤的頻率都爲1次/秒。如果設爲2則表示事務日誌在每次commit都寫入內存log,但內存log寫入磁盤的頻率爲1次/秒。
innodb_log_buffer_size=2M # InnoDB日誌數據緩衝大小,如果緩衝滿了,就會將緩衝中的日誌數據寫入磁盤(flush)。由於一般至少都1秒鐘會寫一次磁盤,所以沒必要設置過大,即使是長事務。
innodb_buffer_pool_size=105M # InnoDB使用緩衝池來緩存索引和行數據。該值設置的越大,則磁盤IO越少。一般將該值設爲物理內存的80%。
innodb_log_file_size=53M # 每一個InnoDB事務日誌的大小。一般設爲innodb_buffer_pool_size的25%到100%
innodb_thread_concurrency=9 # InnoDB內核最大併發線程數