詳細介紹Java垃圾回收機制

垃圾收集GC(Garbage Collection)是Java語言的核心技術之一,之前我們曾專門探討過Java 7新增的垃圾回收器G1的新特性,但在JVM的內部運行機制上看,Java的垃圾回收原理與機制並未改變。垃圾收集的目的在於清除不再使用的對象。GC通過確定對象是否被活動對象引用來確定是否收集該對象。GC首先要判斷該對象是否是時候可以收集。兩種常用的方法是引用計數和對象引用遍歷。

引用計數收集器

引用計數是垃圾收集器中的早期策略。在這種方法中,堆中每個對象(不是引用)都有一個引用計數。當一個對象被創建時,且將該對象分配給一個變量,該變量計數設置爲1。當任何其它變量被賦值爲這個對象的引用時,計數加1(a = b,則b引用的對象+1),但當一個對象的某個引用超過了生命週期或者被設置爲一個新值時,對象的引用計數減1。任何引用計數爲0的對象可以被當作垃圾收集。當一個對象被垃圾收集時,它引用的任何對象計數減1。

優點:引用計數收集器可以很快的執行,交織在程序運行中。對程序不被長時間打斷的實時環境比較有利。

缺點: 無法檢測出循環引用。如父對象有一個對子對象的引用,子對象反過來引用父對象。這樣,他們的引用計數永遠不可能爲0.

跟蹤收集器

早期的JVM使用引用計數,現在大多數JVM採用對象引用遍歷。對象引用遍歷從一組對象開始,沿着整個對象圖上的每條鏈接,遞歸確定可到達(reachable)的對象。如果某對象不能從這些根對象的一個(至少一個)到達,則將它作爲垃圾收集。在對象遍歷階段,GC必須記住哪些對象可以到達,以便刪除不可到達的對象,這稱爲標記(marking)對象。

下一步,GC要刪除不可到達的對象。刪除時,有些GC只是簡單的掃描堆棧,刪除未標記的未標記的對象,並釋放它們的內存以生成新的對象,這叫做清除(sweeping)。這種方法的問題在於內存會分成好多小段,而它們不足以用於新的對象,但是組合起來卻很大。因此,許多GC可以重新組織內存中的對象,並進行壓縮(compact),形成可利用的空間。

爲此,GC需要停止其他的活動活動。這種方法意味着所有與應用程序相關的工作停止,只有GC運行。結果,在響應期間增減了許多混雜請求。另外,更復雜的 GC不斷增加或同時運行以減少或者清除應用程序的中斷。有的GC使用單線程完成這項工作,有的則採用多線程以增加效率。

一些常用的垃圾收集器

(1)標記-清除收集器

這種收集器首先遍歷對象圖並標記可到達的對象,然後掃描堆棧以尋找未標記對象並釋放它們的內存。這種收集器一般使用單線程工作並停止其他操作。並且,由於它只是清除了那些未標記的對象,而並沒有對標記對象進行壓縮,導致會產生大量內存碎片,從而浪費內存。

(2)標記-壓縮收集器

有時也叫標記-清除-壓縮收集器,與標記-清除收集器有相同的標記階段。在第二階段,則把標記對象複製到堆棧的新域中以便壓縮堆棧。這種收集器也停止其他操作。

(3)複製收集器

這種收集器將堆棧分爲兩個域,常稱爲半空間。每次僅使用一半的空間,JVM生成的新對象則放在另一半空間中。GC運行時,它把可到達對象複製到另一半空間,從而壓縮了堆棧。這種方法適用於短生存期的對象,持續複製長生存期的對象則導致效率降低。並且對於指定大小堆來說,需要兩倍大小的內存,因爲任何時候都只使用其中的一半。

 (4) 增量收集器

增量收集器把堆棧分爲多個域,每次僅從一個域收集垃圾,也可理解爲把堆棧分成一小塊一小塊,每次僅對某一個塊進行垃圾收集。這會造成較小的應用程序中斷時間,使得用戶一般不能覺察到垃圾收集器正在工作。

(5)分代收集器

複製收集器的缺點是:每次收集時,所有的標記對象都要被拷貝,從而導致一些生命週期很長的對象被來回拷貝多次,消耗大量的時間。而分代收集器則可解決這個問題,分代收集器把堆棧分爲兩個或多個域,用以存放不同壽命的對象。JVM生成的新對象一般放在其中的某個域中。過一段時間,繼續存在的對象(非短命對象)將獲得使用期並轉入更長壽命的域中。分代收集器對不同的域使用不同的算法以優化性能。

並行收集器

並行收集器使用某種傳統的算法並使用多線程並行的執行它們的工作。在多CPU機器上使用多線程技術可以顯著的提高java應用程序的可擴展性。

最後,貼出一個非常簡單的跟蹤收集器的例圖,以便大家加深對收集器的理解:

跟蹤收集器的例圖

跟蹤收集器圖例

使用垃圾收集器要注意的地方

下面將提出一些有關垃圾收集器要注意的地方,垃圾收集器知識很多,下面只列出一部分必要的知識:

(1)每個對象只能調用finalize( )方法一次。如果在finalize( )方法執行時產生異常(exception),則該對象仍可以被垃圾收集器收集。

(2)垃圾收集器跟蹤每一個對象,收集那些不可觸及的對象(即該對象不再被程序引用 了),回收其佔有的內存空間。但在進行垃圾收集的時候,垃圾收集器會調用該對象的finalize( )方法(如果有)。如果在finalize()方法中,又使得該對象被程序引用(俗稱復活了),則該對象就變成了可觸及的對象,暫時不會被垃圾收集了。但是由於每個對象只能調用一次finalize( )方法,所以每個對象也只可能 "復活 "一次。

(3)Java語言允許程序員爲任何方法添加finalize( )方法,該方法會在垃圾收集器交換回收對象之前被調用。但不要過分依賴該方法對系統資源進行回收和再利用,因爲該方法調用後的執行結果是不可預知的。

(4)垃圾收集器不可以被強制執行,但程序員可以通過調研System.gc方法來建議執行垃圾收集。記住,只是建議。一般不建議自己寫System.gc,因爲會加大垃圾收集工作量。

詳解Java GC的工作原理

概要: JVM內存結構由堆、棧、本地方法棧、方法區等部分組成,另外JVM分別對新生代和舊生代採用不同的垃圾回收機制。

1. 首先來看一下JVM內存結構,它是由堆、棧、本地方法棧、方法區等部分組成,結構圖如下所示。

JVM內存組成結構

1)堆

所有通過new創建的對象的內存都在堆中分配,其大小可以通過-Xmx和-Xms來控制。堆被劃分爲新生代和舊生代,新生代又被進一步劃分爲Eden和Survivor區,最後Survivor由FromSpace和ToSpace組成,結構圖如下所示:

JVM內存結構之堆

新生代。新建的對象都是用新生代分配內存,Eden空間不足的時候,會把存活的對象轉移到Survivor中,新生代大小可以由-Xmn來控制,也可以用-XX:SurvivorRatio來控制Eden和Survivor的比例舊生代。用於存放新生代中經過多次垃圾回收仍然存活的對象

2)棧

每個線程執行每個方法的時候都會在棧中申請一個棧幀,每個棧幀包括局部變量區和操作數棧,用於存放此次方法調用過程中的臨時變量、參數和中間結果

3)本地方法棧

用於支持native方法的執行,存儲了每個native方法調用的狀態

4)方法區

存放了要加載的類信息、靜態變量、final類型的常量、屬性和方法信息。JVM用持久代(PermanetGeneration)來存放方法區,可通過-XX:PermSize和-XX:MaxPermSize來指定最小值和最大值。介紹完了JVM內存組成結構,下面我們再來看一下JVM垃圾回收機制。

2. JVM垃圾回收機制

JVM分別對新生代和舊生代採用不同的垃圾回收機制

新生代的GC:

新生代通常存活時間較短,因此基於Copying算法來進行回收,所謂Copying算法就是掃描出存活的對象,並複製到一塊新的完全未使用的空間中,對應於新生代,就是在Eden和FromSpace或ToSpace之間copy。新生代採用空閒指針的方式來控制GC觸發,指針保持最後一個分配的對象在新生代區間的位置,當有新的對象要分配內存時,用於檢查空間是否足夠,不夠就觸發GC。當連續分配對象時,對象會逐漸從eden到survivor,最後到舊生代,

用javavisualVM來查看,能明顯觀察到新生代滿了後,會把對象轉移到舊生代,然後清空繼續裝載,當舊生代也滿了後,就會報outofmemory的異常,如下圖所示:

outofmemory的異常

在執行機制上JVM提供了串行GC(SerialGC)、並行回收GC(ParallelScavenge)和並行GC(ParNew)

1)串行GC

在整個掃描和複製過程採用單線程的方式來進行,適用於單CPU、新生代空間較小及對暫停時間要求不是非常高的應用上,是client級別默認的GC方式,可以通過-XX:+UseSerialGC來強制指定

2)並行回收GC

在整個掃描和複製過程採用多線程的方式來進行,適用於多CPU、對暫停時間要求較短的應用上,是server級別默認採用的GC方式,可用-XX:+UseParallelGC來強制指定,用-XX:ParallelGCThreads=4來指定線程數

3)並行GC

與舊生代的併發GC配合使用

舊生代的GC:

舊生代與新生代不同,對象存活的時間比較長,比較穩定,因此採用標記(Mark)算法來進行回收,所謂標記就是掃描出存活的對象,然後再進行回收未被標記的對象,回收後對用空出的空間要麼進行合併,要麼標記出來便於下次進行分配,總之就是要減少內存碎片帶來的效率損耗。在執行機制上JVM提供了串行GC(SerialMSC)、並行GC(parallelMSC)和併發GC(CMS),具體算法細節還有待進一步深入研究。

以上各種GC機制是需要組合使用的,指定方式由下表所示:

GC機制組合使用

發佈了32 篇原創文章 · 獲贊 2 · 訪問量 13萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章