一起理解垃圾回收算法

概述

java內存運行時區域的各個部分,其中程序計數器、虛擬機棧、本地方法棧3個區域隨線程而生,隨線程而滅;棧中的棧幀隨着方法的進入和退出而有條不紊地執行這出棧和入棧操作。每一個棧幀中分配多少內存基本上是在類結構確定下來時就已知的(儘管在運行期會由JIT編譯器進行一些優化,但現在基於概念模型的討論中,大體上可以認爲是編譯期可知的),因此這幾個區域的內存分配和回收都具備確定性,在這幾個區域內就不需要過多考慮回收的問題,因爲方法結束或線程結束時,內存自然就更隨着回收了。而java堆和方法區則不一樣,一個接口中的多個實現類需要的內存可能不一樣,一個方法的多個分支需要的內存也可能不一樣,一個接口中的多個實現類需要的內存可能不一樣,一個方法中的多個分支需要的內存也可能不一樣,我們只有在程序處於運行期時才能知道會創建哪些對象,這部分內存的分配和回收都是動態的,垃圾收集器所關注的是這部分內存。

對象已死

1、引用計數算法

概念

給對象中添加一個引用計數器,每當有一個地方引用它時,計數器值就加1;當引用失效時,計數器值就減1;任何時刻計數器爲0的對象就是不可能再被使用的。

優點

實現簡單,判斷效率也很高

缺點

很難解決對象之間的相互引用問題。例如:對象A和對象B都有字段instance,賦值令A.instance = B 及 B.instace = A,除此之外,這兩個對象再無其他任何引用,實際上這兩個對象已經不可能再被訪問,但因爲互相引用,導致它們的引用計數器都不爲0。

事實上,主流的java虛擬機裏面沒有選用引用計數算法來管理內存。

2、可達性分析算法

概念

通過一系列的稱爲**“GC Roots”的對象作爲起始點,從這些節點開始向下搜索,搜索走過的路徑稱爲引用鏈(Reference Chain)**,當一個對象到GC Roots沒有任何引用鏈相連(用圖論的話來說,就是從GC Roots到這個對象是不可達)時,則證明此對象是不可用的。圖片

在java語言中,可作爲GC Roots的對象包括下面幾種:

  • 虛擬機棧(棧幀中的本地變量表)中引用的對象。
  • 方法區中靜態屬性引用的對象
  • 方法區中常量引用的對象
  • 本地方法棧中JNI(即一般說的Native方法)引用的對象

3、引用

在jdk1.2之前,java中的引用定義很傳統:如果reference類型的數據中存儲的數值代表的是另外一塊內存的起始地址,就稱這塊內存代表這一個引用。這種定義很純粹,但是太過狹隘,一個對象在這種定義下只有被引用或者沒有被引用兩種狀態,對於如何描述一些“食之無味、棄之可惜”的對象就顯得無能爲力。

在jdk1.2以後,java對引用的概念進行了擴充:

  • 強引用(Strong Reference):指在程序代碼中普遍存在的,類似“Object obj = new Object()”這類的引用,只要強引用還在,垃圾收集器永遠不會回收掉被引用的對象。
  • 軟引用(Soft Reference):用來描述一些還有用但並非必須的對象。對於軟引用關聯着的對象,在系統將要發生內存溢出異常之前,將會把這些對象列進回收範圍之中進行第二次回收。如果這次回收還沒有足夠內存,纔會拋出內存溢出異常。在jdk1.2以後,提供了SoftReference類來實現軟引用。
  • 弱引用(Weak Reference):用來描述非必須對象,強度比軟引用更弱一些,被弱引用關聯的對象只能生存到下一次垃圾收集發生之前。當垃圾收集器工作時,無論當前內存是否足夠,都會回收掉只被弱引用關聯的對象。在jdk1.2之後,提供了WeakReference類來實現弱引用。
  • 虛引用(Phantom Reference):虛引用也稱爲幽靈引用或者幻引用,它是最弱的一種引用關係。一個對象是否有虛引用存在,完全不會對其生存時間構成影響,也無法通過虛引用來取得一個對象實例。爲一個對象設置虛引用關聯的唯一目的就是能在這個對象被收集器回收時收到一個系統通知。在jdk1.2以後,提供了PhantomReference類來實現虛引用。

4、生存還是死亡(瞭解)

即使在可達性分析算法中不可達的對象,也並非是“非死不可”的,要真正宣告一個對象死亡,至少要經歷兩次標記過程:如果對象在進行可達性分析後發現沒有與GC Roots相連接的引用鏈,那它將會被第一次標記並且進行一次篩選,篩選條件是對此對象是否有必要執行**finalize()**方法。當對象沒有覆蓋finalize()方法,或者finalize()方法已經被虛擬機調用過,虛擬機將這兩種情況都視爲“沒有必要執行”。

如果這個對象被判定爲有必要執行finalize()方法,那麼這個對象將會放置在一個叫做F-Queue的隊列之中,並且在稍後由一個虛擬機自動建立的、低優先級的Finalizer線程去執行它,這裏所謂的“執行”是值虛擬機會觸發這個方法,但並不會承諾它運行結束。finalize()方法是對象逃脫死亡命運的最後一次機會,稍後GC將會對F-Queue中的對象進行第二次小規模的標記,如果對象要在finalize()中成功拯救自己——只要重新與引用鏈上的任何一個對象建立關係即可,在第二次標記時它會被移除出“即將回收”的集合;如果對象這時候還沒有逃脫,那基本上它就真的被回收了。

5、回收方法區

永久代的垃圾主要回收兩部分內容:廢棄常量和無用的類。

回收廢棄常量與回收java堆中的對象非常類似。假如一個字符串“ABC”已經進入常量池中,但是沒有任何String對象引用常量池中的“ABC”常量,如果這時發生內存回收,而且必要的話,這個常量就會被系統清理出常量池。常量池中的其他類(接口)、方法、字段的符號引用也與此類似。

要判斷一個類是否是“無用的類”的條件相對苛刻許多,需要同時滿足下面3個條件:

  • 該類所有的實例都已經被回收,也就是java堆中不存在該類的任何實例;
  • 加載該類的ClassLoader已經被回收;
  • 該類對應的java.lang.Class對象沒有在任何地方被引用,無法在任何地方通過反射訪問該類的方法。

虛擬機可以對滿足上述3個條件的無用類進行回收,這裏說的僅僅是“可以”,而不是和對象一樣,不使用了就必然會回收。是否對類進行回收,HotSpot虛擬機提供了-Xnoclassgc參數進行控制。

在大量使用反射、動態代理、CGLib等ByteCode框架、動態生成JSP以及OSGI這類頻繁自定義ClassLoader的場景都需要虛擬機具備類卸載的功能,以保證永久代不會溢出。

垃圾收集算法

1、標記—清除算法

概念

最基礎的收集算法是“標記—清除”(Mark—Sweep)算法,如同它的名字,算法分爲“標記”和“清除”兩個階段:首先標記出所有需要回收的對象,在標記完成後統一回收所有被標記的對象。之所以說它是最基礎的收集算法,是因爲後續的收集算法都是基於這種思路並對其不足進行改進而得到的。

缺點

  1. 效率問題,標記和清除兩個過程的效率都不高
  2. 空間問題,標記清除後會產生大量不連續的內存碎片,空間碎片過多會可能會導致以後在程序運行過程中需要分配較大對象時,無法找到足夠的連續內存而不得不提前觸發另一次垃圾收集動作。

圖片

2、複製算法

概念

爲了解決效率問題,一種稱爲“複製”(Copying)的收集算法出現了,它將可用內存按容量劃分爲大小相等的兩塊,每次只使用其中的一塊。當這一塊的內存用完了,就將還存活着的對象複製到另外一塊上面,然後再把已使用過的內存空間一次清理掉。這樣使得每次都是對整個半區進行內存回收,內存分配時也就不用考慮內存碎片等複雜情況,只要移動堆頂指針,按順序分配內存即可,實現簡單,運行高效。

缺點

將內存縮小爲了原來的一半,未免太高了一點。並且複製收集算法在對象存活率較高時就要進行較多的複製操作,效率將會變低。更關鍵的是,如果不想浪費50%的空間,就需要有額外的空間進行分配擔保,以應對被使用的內存中所有對象都100%存活的極端情況,所以老年代一半不能直接選用這種算法。

圖片

3、標記—整理算法

標記過程仍然與“標記—清除”算法一樣,但後續步驟不是直接對可回收對象進行清理,而是讓所有存活的對象都向一端移動,然後直接清理掉端邊界以外的內存。

圖片

4、分代收集算法

當前商業虛擬機的垃圾收集都採用“分代收集”(Generational Collection)算法,這種算法沒有什麼新思想,只是根據對象存活週期的不同將內存劃分爲幾塊。一般是把java堆分爲新生代和老年代,這樣可以根據各個年代的特點採用最適合的收集算法。在新生代中,每次垃圾收集時都發現有大批對象死去,只有少量存活,那就選擇複製算法,只需付出少量存活對象的複製成本就可以完成收集。而老年代中因爲對象存活率高、沒有額外空間對他進行分配擔保,就必須採用“標記—清理”或者“標記—整理”算法來進行回收。

內容摘自——《深入理解java虛擬機》
部分圖片引用自:https://www.cnblogs.com/aspirant/p/8662690.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章