關於mysql 刪除數據後物理空間未釋放(轉載)

OPTIMIZE TABLE 當您的庫中刪除了大量的數據後,您可能會發現數據文件尺寸並沒有減小。這是因爲刪除操作後在數據文件中留下碎片所致。OPTIMIZE TABLE 是指對錶進行優化。如果已經刪除了表的一大部分數據,或者如果已經對含有可變長度行的表(含有 VARCHAR 、 BLOB 或 TEXT 列的表)進行了很多更改,就應該使用 OPTIMIZE TABLE 命令來進行表優化。這個命令可以將表中的空間碎片進行合併,並且可以消除由於刪除或者更新造成的空間浪費OPTIMIZE TABLE 命令只對 MyISAM 、 BDB 和 InnoDB 表起作用 。表優化的工作可以每週或者每月定期執行,對提高表的訪問效率有一定的好處,但是需要注意的是,優化表期間會鎖定表,所以一定要安排在空閒時段進行。

一,原始數據

  1. mysql> select count(*) as total from ad_visit_history;  

  2. +---------+  

  3. | total   |  

  4. +---------+  

  5. | 1187096 |                      //總共有118萬多條數據

  6. +---------+  

  7. 1 row in set (0.04 sec)  

2,存放在硬盤中的表文件大小

  1. [root@BlackGhost test1]# ls |grep visit |xargs -i du {}  

  2. 382020    ad_visit_history.MYD                    //數據文件佔了380M

  3. 127116    ad_visit_history.MYI                     //索引文件佔了127M

  4. 12    ad_visit_history.frm                              //結構文件佔了12K

3,查看一下索引信息

  1. mysql> show index from ad_visit_history from test1;     //查看一下該表的索引信息

  2. +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+  

  3. | Table            | Non_unique | Key_name          | Seq_in_index | Column_name   | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment |  

  4. +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+  

  5. | ad_visit_history |          0 | PRIMARY           |            1 | id            | A         |     1187096 |     NULL | NULL   |      | BTREE      |         |  

  6. | ad_visit_history |          1 | ad_code           |            1 | ad_code       | A         |          46 |     NULL | NULL   | YES  | BTREE      |         |  

  7. | ad_visit_history |          1 | unique_id         |            1 | unique_id     | A         |     1187096 |     NULL | NULL   | YES  | BTREE      |         |  

  8. | ad_visit_history |          1 | ad_code_ind       |            1 | ad_code       | A         |          46 |     NULL | NULL   | YES  | BTREE      |         |  

  9. | ad_visit_history |          1 | from_page_url_ind |            1 | from_page_url | A         |       30438 |     NULL | NULL   | YES  | BTREE      |         |  

  10. | ad_visit_history |          1 | ip_ind            |            1 | ip            | A         |      593548 |     NULL | NULL   | YES  | BTREE      |         |  

  11. | ad_visit_history |          1 | port_ind          |            1 | port          | A         |       65949 |     NULL | NULL   | YES  | BTREE      |         |  

  12. | ad_visit_history |          1 | session_id_ind    |            1 | session_id    | A         |     1187096 |     NULL | NULL   | YES  | BTREE      |         |  

  13. +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+  

  14. 8 rows in set (0.28 sec)  

索引信息中的列的信息說明。

Table :表的名稱。 Non_unique :如果索引不能包括重複詞,則爲0。如果可以,則爲1。 Key_name :索引的名稱。 Seq_in_index :索引中的列序列號,從1開始。 Column_name :列名稱。 Collation :列以什麼方式存儲在索引中。在MySQLSHOW INDEX語法中,有值’A’(升序)或NULL(無分類)。 Cardinality :索引中唯一值的數目的估計值。通過運行ANALYZE TABLE或myisamchk -a可以更新。基數根據被存儲爲整數的統計數據來計數,所以即使對於小型表,該值也沒有必要是精確的。基數越大,當進行聯合時,MySQL使用該索引的機會就越大。 Sub_part :如果列只是被部分地編入索引,則爲被編入索引的字符的數目。如果整列被編入索引,則爲NULL。 Packed :指示關鍵字如何被壓縮。如果沒有被壓縮,則爲NULL。 Null :如果列含有NULL,則含有YES。如果沒有,則爲空。 Index_type :存儲索引數據結構方法(BTREE, FULLTEXT, HASH, RTREE)

二,刪除一半數據

  1. mysql> delete from ad_visit_history where id>598000;          //刪除一半數據

  2. Query OK, 589096 rows affected (4 min 28.06 sec)  

  3. [root@BlackGhost test1]# ls |grep visit |xargs -i du {}              //相對應的MYD,MYI文件大小沒有變化

  4. 382020    ad_visit_history.MYD  

  5. 127116    ad_visit_history.MYI  

  6. 12    ad_visit_history.frm  

按常規思想來說,如果在數據庫中刪除了一半數據後,相對應的.MYD,.MYI文件也應當變爲之前的一半。但是刪除一半數據後,.MYD.MYI盡然連1KB都沒有減少,這是多麼的可怕啊。

我們在來看一看,索引信息

Mysql> show index from ad_visit_history;    
  1. +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+    

  2. | Table            | Non_unique | Key_name          | Seq_in_index | Column_name   | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment |    

  3. +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+    

  4. | ad_visit_history |          0 | PRIMARY           |            1 | id            | A         |      598000 |     NULL | NULL   |      | BTREE      |         |    

  5. | ad_visit_history |          1 | ad_code           |            1 | ad_code       | A         |          23 |     NULL | NULL   | YES  | BTREE      |         |    

  6. | ad_visit_history |          1 | unique_id         |            1 | unique_id     | A         |      598000 |     NULL | NULL   | YES  | BTREE      |         |    

  7. | ad_visit_history |          1 | ad_code_ind       |            1 | ad_code       | A         |          23 |     NULL | NULL   | YES  | BTREE      |         |    

  8. | ad_visit_history |          1 | from_page_url_ind |            1 | from_page_url | A         |       15333 |     NULL | NULL   | YES  | BTREE      |         |    

  9. | ad_visit_history |          1 | ip_ind            |            1 | ip            | A         |      299000 |     NULL | NULL   | YES  | BTREE      |         |    

  10. | ad_visit_history |          1 | port_ind          |            1 | port          | A         |       33222 |     NULL | NULL   | YES  | BTREE      |         |    

  11. | ad_visit_history |          1 | session_id_ind    |            1 | session_id    | A         |      598000 |     NULL | NULL   | YES  | BTREE      |         |    

  12. +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+    

  13. 8 rows in set (0.00 sec)    

對比一下,這次索引查詢和上次索引查詢,裏面的數據信息基本上是上次一次的一本,這點還是合乎常理。

三,用optimize table來優化一下

Java代碼  收藏代碼
  1. mysql> optimize table ad_visit_history;                                             //刪除數據後的優化

  2. +------------------------+----------+----------+----------+  

  3. | Table                  | Op       | Msg_type | Msg_text |  

  4. +------------------------+----------+----------+----------+  

  5. | test1.ad_visit_history | optimize | status   | OK       |  

  6. +------------------------+----------+----------+----------+  

  7. 1 row in set (1 min 21.05 sec)  

1,查看一下.MYD,.MYI文件的大小

  1. [root@BlackGhost test1]# ls |grep visit |xargs -i du {}  

  2. 182080    ad_visit_history.MYD                                          //數據文件差不多爲優化前的一半

  3. 66024    ad_visit_history.MYI                                             //索引文件也一樣,差不多是優化前的一半

  4. 12    ad_visit_history.frm  

2,查看一下索引信息

mysql> show index from ad_visit_history;    
  1. +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+    

  2. | Table            | Non_unique | Key_name          | Seq_in_index | Column_name   | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment |    

  3. +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+    

  4. | ad_visit_history |          0 | PRIMARY           |            1 | id            | A         |      598000 |     NULL | NULL   |      | BTREE      |         |    

  5. | ad_visit_history |          1 | ad_code           |            1 | ad_code       | A         |          42 |     NULL | NULL   | YES  | BTREE      |         |    

  6. | ad_visit_history |          1 | unique_id         |            1 | unique_id     | A         |      598000 |     NULL | NULL   | YES  | BTREE      |         |    

  7. | ad_visit_history |          1 | ad_code_ind       |            1 | ad_code       | A         |          42 |     NULL | NULL   | YES  | BTREE      |         |    

  8. | ad_visit_history |          1 | from_page_url_ind |            1 | from_page_url | A         |       24916 |     NULL | NULL   | YES  | BTREE      |         |    

  9. | ad_visit_history |          1 | ip_ind            |            1 | ip            | A         |      598000 |     NULL | NULL   | YES  | BTREE      |         |    

  10. | ad_visit_history |          1 | port_ind          |            1 | port          | A         |       59800 |     NULL | NULL   | YES  | BTREE      |         |    

  11. | ad_visit_history |          1 | session_id_ind    |            1 | session_id    | A         |      598000 |     NULL | NULL   | YES  | BTREE      |         |    

  12. +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+    

  13. 8 rows in set (0.00 sec)    

從以上數據我們可以得出,ad_code,ad_code_ind,from_page_url_ind等索引機會差不多都提高了85%,這樣效率提高了好多。

四,小結

結合mysql官方網站的信息,個人是這樣理解的。當你刪除數據 時,mysql並不會回收,被已刪除數據的佔據的存儲空間,以及索引位。而是空在那裏,而是等待新的數據來彌補這個空缺,這樣就有一個缺少,如果一時半 會,沒有數據來填補這個空缺,那這樣就太浪費資源了。所以對於寫比較頻煩的表,要定期進行optimize,一個月一次,看實際情況而定了。

舉個例子來說吧。有100個php程序員辭職了,但是呢只是人走了,php的職位還在那裏,這些職位不會撤銷,要等新的php程序來填補這些空位。招一個好的程序員,比較難。我想大部分時間會空在那裏。哈哈。

五,手冊中關於OPTIMIZE的一些用法和描述

OPTIMIZE [LOCAL | NO_WRITE_TO_BINLOG] TABLE tbl_name [, tbl_name] ...

如果您已經刪除了表的一大部分,或者如果您已經對含有可變長度行的表(含有VARCHAR, BLOB或TEXT列的表)進行了很多更改,則應使用 OPTIMIZE TABLE。被刪除的記錄被保持在鏈接清單中,後續的INSERT操作會重新使用舊的記錄位置。您可以使用OPTIMIZE TABLE來重新 利用未使用的空間,並整理數據文件的碎片。

在多數的設置中,您根本不需要運行OPTIMIZE TABLE。即使您對可變長度的行進行了大量的更新,您也不需要經常運行,每週一次或每月一次 即可,只對特定的表運行。

OPTIMIZE TABLE只對MyISAM, BDB和InnoDB表起作用。

注意,在OPTIMIZE TABLE運行過程中,MySQL會鎖定表。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章