Java 垃圾回收機制與算法

話不多說,首先來引入一張圖然後來進行具體的解釋:
在這裏插入圖片描述
引言:Java語言中一個顯著的特點就是引入了垃圾回收機制,使c++程序員最頭疼的內存管理的問題迎刃而解,它使得Java程序員在編寫程序的時候不再需要考慮內存管理。垃圾回收可以有效的防止內存泄露,有效的使用空閒的內存。

內存泄露:是指該內存空間使用完畢之後未回收,在不涉及複雜數據結構的一般情況下,Java 的內存泄露表現爲一個內存對象的生命週期超出了程序需要它的時間長度,我們有時也將其稱爲“對象遊離”。

一、什麼是垃圾回收

垃圾回收(Garbage Collection,GC),顧名思義就是釋放垃圾佔用的空間,防止內存泄露。有效的使用可以使用的內存,對內存堆中已經死亡的或者長時間沒有使用的對象進行清除和回收。

二、怎麼定義垃圾

既然我們要做垃圾回收,首先我們得搞清楚垃圾的定義是什麼,哪些內存是需要回收的。

三、如何判斷對象已死

1.引用計數算法

引用計數算法(Reachability Counting)是通過在對象頭中分配一個空間來保存該對象被引用的次數(Reference Count)。如果該對象被其它對象引用,則它的引用計數加1,如果刪除對該對象的引用,那麼它的引用計數就減1,當該對象的引用計數爲0時,那麼該對象就會被回收。

String m = newString(“jack”);

先創建一個字符串,這時候"jack"有一個引用,就是 m。
在這裏插入圖片描述
然後將 m 設置爲 null,這時候"jack"的引用次數就等於0了,在引用計數算法中,意味着這塊內容就需要被回收了。

m = null;
在這裏插入圖片描述
那是什麼原因導致我們最終放棄了引用計數算法呢?看下面的例子。

  1. 定義2個對象

  2. 相互引用

  3. 置空各自的聲明引用
    在這裏插入圖片描述
    我們可以看到,最後這2個對象已經不可能再被訪問了,但由於他們相互引用着對方,導致它們的引用計數永遠都不會爲0,通過引用計數算法,也就永遠無法通知GC收集器回收它們。

總結:引用計數法實現簡單,判定效率也比較高,在大部分情況下都是一個不錯的算法。比如Python語言就採用引用計數法進行內存管理。但是,在主流的JVM中沒有選用引用計數法來管理內存,最主要的原因就是引用計數法無法解決對象的循環引用問題。

2.可達性分析算法

可達性分析算法(Reachability Analysis)的基本思路是,通過一些被稱爲引用鏈(GC Roots)的對象作爲起點,從這些節點開始向下搜索,搜索走過的路徑被稱爲引用鏈(Reference Chain),當一個對象到 GC Roots 沒有任何引用鏈相連時(即從 GC Roots 節點到該節點不可達),則證明該對象是不可用的。
在這裏插入圖片描述
通過可達性算法,成功解決了引用計數所無法解決的問題-“循環依賴”,只要你無法與 GC Root 建立直接或間接的連接,系統就會判定你爲可回收對象。那這樣就引申出了另一個問題,哪些屬於 GC Root。

Java 內存區域

在這裏插入圖片描述
在 Java 語言中,可作爲 GC Root 的對象包括以下4種:

  • 虛擬機棧(棧幀中的本地變量表)中引用的對象
  • 方法區中類靜態屬性引用的對象
  • 方法區中常量引用的對象
  • 本地方法棧中 JNI(即一般說的 Native 方法)引用的對象

四、怎麼回收垃圾

在確定了哪些垃圾可以被回收後,垃圾收集器要做的事情就是開始進行垃圾回收,但是這裏面涉及到一個問題是:如何高效地進行垃圾回收。由於Java虛擬機規範並沒有對如何實現垃圾收集器做出明確的規定,因此各個廠商的虛擬機可以採用不同的方式來實現垃圾收集器,這裏我們討論幾種常見的垃圾收集算法的核心思想。

1.標記 — 清除算法

在這裏插入圖片描述
標記清除算法(Mark-Sweep)是最基礎的一種垃圾回收算法,它分爲2部分,先把內存區域中的這些對象進行標記,哪些屬於可回收標記出來,然後把這些垃圾拎出來清理掉。就像上圖一樣,清理掉的垃圾就變成未使用的內存區域,等待被再次使用。

這邏輯再清晰不過了,並且也很好操作,但它存在一個很大的問題,那就是內存碎片。

上圖中等方塊的假設是 2M,小一些的是 1M,大一些的是 4M。等我們回收完,內存就會切成了很多段。我們知道開闢內存空間時,需要的是連續的內存區域,這時候我們需要一個 2M的內存區域,其中有2個 1M 內存區域是沒法用的。這樣就導致,其實我們本身還有這麼多的內存的,但卻用不了。

總結:
a) 效率問題,標記和清除兩個過程的效率都不高;
b) 空間問題,標記清除之後會產生大量不連續的內存碎片,空間碎片太多可能會導致以後在程序運行過程中需要分配較大對象的內存空間時,無法找到足夠的連續內存而不得不提前觸發另一次垃圾收集動作。

2、複製算法:

2.複製算法

在這裏插入圖片描述
複製算法(Copying)是在標記清除算法上演化而來,解決標記清除算法的內存碎片問題。它將可用內存按容量劃分爲大小相等的兩塊,每次只使用其中的一塊。當這一塊的內存用完了,就將還存活着的對象複製到另外一塊上面,然後再把已使用過的內存空間一次清理掉。保證了內存的連續可用,內存分配時也就不用考慮內存碎片等複雜情況,邏輯清晰,運行高效。

上面的圖很清楚,也很明顯的暴露了另一個問題,合着我這140平的大三房,只能當70平米的小兩房來使?代價實在太高。

總結:這種算法的代價是將內存縮小爲原來的一半,代價太高。

3.標記整理算法

在這裏插入圖片描述
標記整理算法(Mark-Compact)標記過程仍然與標記 — 清除算法一樣,但後續步驟不是直接對可回收對象進行清理,而是讓所有存活的對象都向一端移動,再清理掉端邊界以外的內存區域。

標記整理算法一方面在標記-清除算法上做了升級,解決了內存碎片的問題,也規避了複製算法只能利用一半內存區域的弊端。看起來很美好,但從上圖可以看到,它對內存變動更頻繁,需要整理所有存活對象的引用地址,在效率上比複製算法要差很多。

4.分代收集算法

分代收集算法(Generational Collection)嚴格來說並不是一種思想或理論,而是融合上述3種基礎的算法思想,而產生的針對不同的情況所採用不同算法的一套組合拳。

  • 對象存活週期的不同將內存劃分爲幾塊。一般是把 Java 堆分爲新生代和老年代,這樣就可以根據各個年代的特點採用最適當的收集算法。在新生代中,每次垃圾收集時都發現有大批對象死去,只有少量存活,那就選用複製算法,只需要付出少量存活對象的複製成本就可以完成收集。而老年代中因爲對象存活率高、沒有額外空間對它進行分配擔保,就必須使用標記-清理或者標記 — 整理算法來進行回收。

以上部分材料來自於收集他人的文章。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章