面試官問:MySQL 刪除表數據,磁盤空間還一直被佔用,爲什麼?

來源:www.toutiao.com/i6935264754059477542/

最近有個上位機獲取下位機上報數據的項目,由於上報頻率比較頻繁且數據量大,導致數據增長過快,磁盤佔用多。

爲了節約成本,定期進行數據備份,並通過delete刪除表記錄。

明明已經執行了delete,可表文件的大小卻沒減小,令人費解

項目中使用Mysql作爲數據庫,對於表來說,一般爲表結構和表數據。表結構佔用空間都是比較小的,一般都是表數據佔用的空間。

當我們使用 delete刪除數據時,確實刪除了表中的數據記錄,但查看錶文件大小卻沒什麼變化。

Mysql數據結構

凡是使用過mysql,對B+樹肯定是有所耳聞的,MySQL InnoDB 中採用了 B+ 樹作爲存儲數據的結構,也就是常說的索引組織表,並且數據時按照頁來存儲的。因此在刪除數據時,會有兩種情況:

  • 刪除數據頁中的某些記錄
  • 刪除整個數據頁的內容

表文件大小未更改和mysql設計有關

比如想要刪除 R4 這條記錄:

InnoDB 直接將 R4 這條記錄標記爲刪除,稱爲可複用的位置。如果之後要插入 ID 在 300 到 700 間的記錄時,就會複用該位置。

由此可見,磁盤文件的大小並不會減少。

通用刪除整頁數據也將記錄標記刪除,數據就複用用該位置,與刪除默寫記錄不同的是,刪除整頁記錄,當後來插入的數據不在原來的範圍時,都可以複用位置,而如果只是刪除默寫記錄,是需要插入數據符合刪除記錄位置的時候才能複用。

因此,無論是數據行的刪除還是數據頁的刪除,都是將其標記爲刪除的狀態,用於複用,所以文件並不會減小。

那怎麼才能讓表大小變小

DELETE只是將數據標識位刪除,並沒有整理數據文件,當插入新數據後,會再次使用這些被置爲刪除標識的記錄空間,可以使用OPTIMIZE TABLE來回收未使用的空間,並整理數據文件的碎片。

OPTIMIZE TABLE 表名;

注意:OPTIMIZE TABLE只對MyISAM, BDB和InnoDB表起作用。

另外,也可以執行通過ALTER TABLE重建表

ALTER TABLE 表名 ENGINE=INNODB

有人會問OPTIMIZE TABLE和ALTER TABLE有什麼區別?

alter table t engine = InnoDB(也就是recreate),而 optimize table t 等於 recreate+analyze

Online DDL

最後,再說一下Online DDL,dba的日常工作肯定有一項是ddl變更,ddl變更會鎖表,這個可以說是dba心中永遠的痛,特別是執行ddl變更,導致庫上大量線程處於“Waiting for meta data lock”狀態的時候。因此在 5.6 版本後引入了 Online DDL。

Online DDL推出以前,執行ddl主要有兩種方式copy方式和inplace方式,inplace方式又稱爲(fast index creation)。相對於copy方式,inplace方式不拷貝數據,因此較快。但是這種方式僅支持添加、刪除索引兩種方式,而且與copy方式一樣需要全程鎖表,實用性不是很強。Online方式與前兩種方式相比,不僅可以讀,還可以支持寫操作。

執行online DDL語句的時候,使用ALGORITHM和LOCK關鍵字,這兩個關鍵字在我們的DDL語句的最後面,用逗號隔開即可。示例如下:

ALTER TABLE tbl_name ADD COLUMN col_name col_type, ALGORITHM=INPLACE, LOCK=NONE;

ALGORITHM選項

  • INPLACE:替換:直接在原表上面執行DDL的操作。
  • COPY:複製:使用一種臨時表的方式,克隆出一個臨時表,在臨時表上執行DDL,然後再把數據導入到臨時表中,在重命名等。這期間需要多出一倍的磁盤空間來支撐這樣的 操作。執行期間,表不允許DML的操作。
  • DEFAULT:默認方式,有MySQL自己選擇,優先使用INPLACE的方式。

LOCK選項

  • SHARE:共享鎖,執行DDL的表可以讀,但是不可以寫。
  • NONE:沒有任何限制,執行DDL的表可讀可寫。
  • EXCLUSIVE:排它鎖,執行DDL的表不可以讀,也不可以寫。
  • DEFAULT:默認值,也就是在DDL語句中不指定LOCK子句的時候使用的默認值。如果指定LOCK的值爲DEFAULT,那就是交給MySQL子句去覺得鎖還是不鎖表。不建議使用,如果你確定你的DDL語句不會鎖表,你可以不指定lock或者指定它的值爲default,否則建議指定它的鎖類型。

執行DDL操作時,ALGORITHM選項可以不指定,這時候MySQL按照INSTANT、INPLACE、COPY的順序自動選擇合適的模式。也可以指定ALGORITHM=DEFAULT,也是同樣的效果。如果指定了ALGORITHM選項,但不支持的話,會直接報錯。

OPTIMIZE TABLE 和 ALTER TABLE 表名 ENGINE=INNODB都支持Oline DDL,但依舊建議在業務訪問量低的時候使用

總結

delete 刪除數據時,其實對應的數據行並不是真正的刪除,僅僅是將其標記成可複用的狀態,所以表空間不會變小。

可以重建表的方式,快速將delete數據後的表變小(OPTIMIZE TABLE 或ALTER TABLE),在 5.6 版本後,創建表已經支持 Online 的操作,但最好是在業務低峯時使用

近期熱文推薦:

1.1,000+ 道 Java面試題及答案整理(2021最新版)

2.別在再滿屏的 if/ else 了,試試策略模式,真香!!

3.臥槽!Java 中的 xx ≠ null 是什麼新語法?

4.Spring Boot 2.5 重磅發佈,黑暗模式太炸了!

5.《Java開發手冊(嵩山版)》最新發布,速速下載!

覺得不錯,別忘了隨手點贊+轉發哦!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章