mysql 索引,死鎖 配置 等 基礎理論知識整理

MyISAM和InnoDB的區別

  1. MySQL默認採用的是MyISAM。
  2. MyISAM不支持事務,而InnoDB支持( 提供了具有事務(commit)、回滾(rollback)和崩潰修復能力(crash recovery capabilities)的事務安全(transaction-safe (ACID compliant))型表)。InnoDB的AUTOCOMMIT默認是打開的,即每條SQL語句會默認被封裝成一個事務,自動提交,會影響速度,所以最好是把多條SQL語句顯示放在begin和commit之間,組成一個事務去提交。
  3. InnoDB支持數據行鎖定,MyISAM不支持行鎖定,只支持鎖定整個表。即MyISAM同一個表上的讀鎖和寫鎖是互斥的,MyISAM併發讀寫時如果等待隊列中既有讀請求又有寫請求,默認寫請求的優先級高,即使讀請求先到,所以MyISAM不適合於有大量查詢和修改並存的情況,那樣查詢進程會長時間阻塞。因爲MyISAM是鎖表,所以某項讀操作比較耗時會使其他寫進程餓死。
  4. InnoDB支持外鍵,MyISAM不支持。
  5. InnoDB的主鍵範圍更大,最大是MyISAM的2倍。
  6. InnoDB不支持全文索引,而MyISAM支持。全文索引是指對char、varchar和text中的每個詞(停用詞除外)建立倒排序索引。MyISAM的全文索引其實沒啥用,因爲它不支持中文分詞,必須由使用者分詞後加入空格再寫到數據表裏,而且少於4個漢字的詞會和停用詞一樣被忽略掉。
  7. MyISAM支持GIS數據,InnoDB不支持。即MyISAM支持以下空間數據對象:Point,Line,Polygon,Surface等。
  8. 沒有where的count(*)使用MyISAM要比InnoDB快得多。因爲MyISAM內置了一個計數器,count(*)時它直接從計數器中讀,而InnoDB必須掃描全表。所以在InnoDB上執行count(*)時一般要伴隨where,且where中要包含主鍵以外的索引列。爲什麼這裏特別強調“主鍵以外”?因爲InnoDB中primary index是和raw data存放在一起的,而secondary index則是單獨存放,然後有個指針指向primary key。所以只是count(*)的話使用secondary index掃描更快,而primary key則主要在掃描索引同時要返回raw data時的作用較大。

索引的類型

聚簇索引:clustered index 其實數據存儲結構,索引和記錄(全部)內容保存同一個結構中。“聚簇”就是索引和記錄緊密在一起,分開就不是聚簇索引了,所以一張表只能有唯一的聚簇索引。

非聚簇索引:secondary index ,葉子節點保存了主鍵值,要定位記錄還要再查一遍聚簇索引。

覆蓋索引:覆蓋索引是指索引的葉子節點已包含所有要查詢的列,因此不需要訪問表數據(回表~~有學個名詞,查詢聚簇索引)


聚簇索引與非聚簇索引的區別

對於聚簇索引存儲來說,行數據和主鍵B+樹存儲在一起,輔助鍵B+樹只存儲輔助鍵和主鍵,主鍵和非主鍵B+樹幾乎是兩種類型的樹。

對非聚簇索引存儲來說,主鍵B+樹在葉子節點存儲指向真正數據行的指針,而非主鍵。

查找時能不能直接定位:聚簇索引的葉節點就是數據節點,而非聚簇索引的頁節點仍然是索引檢點,並保留一個鏈接指向對應數據塊。

物理排序:聚簇索引對數據進行物理的排序,非聚簇索引不對數據進行物理排序

InnoDB使用的是聚簇索引,

將主鍵組織到一棵B+樹中,而行數據就儲存在葉子節點上,若使用"where id = 14"這樣的條件查找主鍵,則按照B+樹的檢索算法即可查找到對應的葉節點,

        之後獲得行數據。若對Name列進行條件搜索,則需要兩個步驟:第一步在輔助索引B+樹中檢索Name,到達其葉子節點獲取對應的主鍵。

      第二步使用主鍵在主索引B+樹種再執行一次B+樹檢索操作,最終到達葉子節點即可獲取整行數據。

MyISM使用的是非聚簇索引,

非聚簇索引的兩棵B+樹看上去沒什麼不同,節點的結構完全一致只是存儲的內容不同而已,主鍵索引B+樹的節點存儲了主鍵,輔助鍵索引B+樹存儲了輔助鍵。表數據存儲在獨立的地方,這兩顆B+樹的葉子節點都使用一個地址指向真正的表數據,對於表數據來說,這兩個鍵沒有任何差別。由於索引樹是獨立的,通過輔助鍵檢索無需訪問主鍵的索引樹。

爲了更形象說明這兩種索引的區別,我們假想一個表如下圖存儲了4行數據。其中Id作爲主索引,Name作爲輔助索引。圖示清晰的顯示了聚簇索引和非聚簇索引的差異。


鎖表的情況

用索引字段做爲條件進行修改時, 是否表鎖的取決於這個索引字段能否確定記錄唯一,當索引值對應記錄不唯一,會進行鎖表,相反則行鎖。

同一個表,如果進行刪除操作時,儘量讓刪除條件統一,否則會相互影響造成鎖表

解決

mysql>show processlist;

mysql>kill thread_id;


相關參數

my.ini(Linux系統下是my.cnf),當mysql服務器啓動時它會讀取這個文件,設置相關的運行環境參數。

my.ini分爲兩塊:Client Section和Server Section。

Client Section用來配置MySQL客戶端參數。
要查看配置參數可以用下面的命令:show variables like'%innodb%'; # 查看innodb相關配置參數

show status like'%innodb%'; # 查看innodb相關的運行時參數(比如當前正在打開的表的數量,當前已經打開的表的數量)
show global status like'open%tables'; # 查看全局的運行時參數,加上global是對當前mysql服務器中運行的所有數據庫實例進行統計。不加global則只對當前數據庫實例進行統計。


1、Client Section

    [client]
    port = 3306 # 設置mysql客戶端連接服務端時默認使用的端口
    [mysql]
    default-character-set=utf8 # 設置mysql客戶端默認字符集

2、Server Section

[mysqld]
port=3306 # mysql服務端默認監聽(listen on)的TCP/IP端口
basedir="C:/Program Files/MySQL/MySQL Server 5.5/" # 基準路徑,其他路徑都相對於這個路徑

datadir="C:/Program Files/MySQL/MySQL Server 5.5/Data" # mysql數據庫文件所在目錄

character-set-server=latin1 # 服務端使用的字符集默認爲8比特編碼的latin1字符集

default-storage-engine=INNODB # 創建新表時將使用的默認存儲引擎

sql-mode="STRICT_TRANS_TABLES,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION" # SQL模式爲strict模式

max_connections=100 # mysql服務器支持的最大併發連接數。但總會預留其中的一個連接給管理員使用超級權限登錄,如果設置得過小而用戶比較多,會經常出現“Too many connections”錯誤。

query_cache_size=0 # 查詢緩存大小,用於緩存SELECT查詢結果。如果有許多返回相同查詢結果的SELECT查詢,並且很少改變表,可以設置query_cache_size大於0,可以極大改善查詢效率。而如果表數據頻繁變化,就不要使用這個,會適得其反

table_cache=256 # 這個參數在5.1.3之後的版本中叫做table_open_cache,用於設置table高速緩存的數量。由於每個客戶端連接都會至少訪問一個表,因此此參數的值與 max_connections有關。當某一連接訪問一個表時,MySQL會檢查當前已緩存表的數量。如果該表已經在緩存中打開,則會直接訪問緩存中的表已加快查詢速度;如果該表未被緩存,則會將當前的表添加進緩存並進行查詢。在執行緩存操作之前,table_cache用於限制緩存表的最大數目:如果當前已經緩存的表未達到table_cache,則會將新表添加進來;若已經達到此值,MySQL將根據緩存表的最後查詢時間、查詢率等規則釋放之前的緩存。

tmp_table_size=34M # 內存中的每個臨時表允許的最大大小。如果臨時表大小超過該值,臨時表將自動轉爲基於磁盤的表(Disk Based Table)。

thread_cache_size=8 # 緩存的最大線程數。當客戶端連接斷開時,如果客戶端總連接數小於該值,則處理客戶端任務的線程放回緩存。在高併發情況下,如果該值設置得太小,就會有很多線程頻繁創建,線程創建的開銷會變大,查詢效率也會下降。一般來說如果在應用端有良好的多線程處理,這個參數對性能不會有太大的提高。

# MyISAM相關參數
myisam_max_sort_file_size=100G # mysql重建索引時允許使用的臨時文件最大大小

myisam_sort_buffer_size=68M

key_buffer_size=54M # Key Buffer大小,用於緩存MyISAM表的索引塊。決定數據庫索引處理的速度(尤其是索引讀)

read_buffer_size=64K # 用於對MyISAM表全表掃描時使用的緩衝區大小。針對每個線程進行分配(前提是進行了全表掃描)。進行排序查詢時,MySql會首先掃描一遍該緩衝,以避免磁盤搜索,提高查詢速度,如果需要排序大量數據,可適當調高該值。但MySql會爲每個客戶連接發放該緩衝空間,所以應儘量適當設置該值,以避免內存開銷過大。

read_rnd_buffer_size=256K

sort_buffer_size=256K # connection級參數(爲每個線程配置),500個線程將消耗500*256K的sort_buffer_size。

# InnoDB相關參數
innodb_additional_mem_pool_size=3M # InnoDB用於存儲元數據信息的內存池大小,一般不需修改

innodb_flush_log_at_trx_commit =1 # 事務相關參數,如果值爲1,則InnoDB在每次commit都會將事務日誌寫入磁盤(磁盤IO消耗較大),這樣保證了完全的ACID特性。而如果設置爲0,則表示事務日誌
寫入內存log和內存log寫入磁盤的頻率都爲1次/秒。如果設爲2則表示事務日誌在每次commit都寫入內存log,但內存log寫入磁盤的頻率爲1次/秒。

innodb_log_buffer_size=2M # InnoDB日誌數據緩衝大小,如果緩衝滿了,就會將緩衝中的日誌數據寫入磁盤(flush)。由於一般至少都1秒鐘會寫一次磁盤,所以沒必要設置過大,即使是長事務。

innodb_buffer_pool_size=105M # InnoDB使用緩衝池來緩存索引和行數據。該值設置的越大,則磁盤IO越少。一般將該值設爲物理內存的80%

innodb_log_file_size=53M # 每一個InnoDB事務日誌的大小。一般設爲innodb_buffer_pool_size的25%到100%

innodb_thread_concurrency=9 # InnoDB內核最大併發線程數



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章