JVM垃圾收集算法

在JVM中,程序計數器、虛擬機棧、本地方法棧3個區域隨着線程而生,隨線程而滅;棧中的棧幀隨着方法的進入和退出而有條不紊的執行的出棧和入棧操作。每個棧幀中分配多少內存基本上是在類結構確定下來時就已知的,因此這幾個區域的內存分配和回收都具備確定性,因此這幾個區域內疚不需要過多考慮回收的問題,因爲方法結束或者線程結束時,內存自然就隨着回收了。而Java堆和方法區則不一樣,一個接口中的多個實現類需要的內存可能不一樣,一個方法中的多個分支需要的內存也不一樣,我們只有在程序處於運行期間才能知道會創建哪些對象,這部分內存的分配和回收都是動態的,垃圾收集器所關注的是這部分內存,所以本篇文章所說的內存分配和回收指的也是這一部分內存。
[b]判斷對象是否已死[/b]
[list] [*]引用計數算法
[*]可達性分析算法[/list]
1、引用計數算法
定義:給對象添加一個引用計數器,每當有一個地方引用它時,計數器值就加1;引用失效時,計數器值就減1;任何時刻計數器爲0的對象就是不可能再被使用的。
但是目前主流的JAVA虛擬機並沒有選用引用計數算法來管理內存,其中最主要的原因是它很難解決對象之間相互循環引用的問題(比如objA.instance=objB;ObjB.instance=objA)。
2、可達性分析算法
主流的商用程序語言(Java,C#等)的主流實現中,都是通過可達性分析(Reachability Analysis)來判定對象是否存活的。這個算法的思路是通過一系列的稱爲"GC Roots"的對象作爲起始點,從這些結點開始向下搜索,搜索走過的路徑稱爲引用鏈(Reference Chain),當一個對象到GC Roots沒有任何引用鏈相連時(也就是說從GC Roots到這個對象不可達),則證明此對象是不可用的。
在Java中,可作爲GC Roots的對象包括下面幾種:[list] [*]虛擬機棧(棧幀中的本地變量表)中引用的對象。
[*]方法區中類靜態屬性引用的對象。
[*]方法區中常量引用的對象。
[*]本地方法棧中JNI(即Native方法)引用的對象。
[/list]

[b]
JVM的垃圾收集算法主要包含以下幾種:[/b]
一、標記-清除算法(Mark-Sweep)
這是最基礎的收集算法,如同它的名字一樣,算法分爲“標記”和“清除”兩個階段:首先標記出所有需要回收的對象,在標記完成後統一回收所有被標記的對象,它的標記過程其實就是前面所說的引用計數和可達性分析算法的結果。
之所以說他是最基礎的收集算法,是因爲後續的收集算法都是基於這種思路並對其不足進行改進得到的。它的不足之處有兩個:一個是效率問題,標記和清除兩個過程的效率都不高;另一個是空間問題,標記清除之後會產生大量不連續的內存碎片,空間碎片太多可能會導致以後在程序運行過程中需要分配較大對象時,無法找到足夠的連續內存而不得不提前觸發另一次垃圾收集動作。標記-清除算法的執行過程如下圖所示:
[img]http://dl2.iteye.com/upload/attachment/0120/3771/e6bb82dd-b5ad-3d15-a6fd-4d686613aff7.png[/img]
二、複製算法(Copying)
爲了解決效率問題,一種稱爲“複製”(Copying)的手機算法出現了,這種算法將可用內存按照容量分爲大小相等的兩塊,每次只使用其中的一塊。當這一塊的內存用完了,就將還存活着的對象複製到另外一塊上面,然後再把已使用過的內存空間一次清理掉。這樣使得每次都是對整個半區進行內存回收,內存分配時也就不用考慮內存碎片的問題了,只要移動堆頂指針,按順序分配內存即可,實現簡單,運行高效。這種做法的代價是將內存縮小爲原來的一半,其實簡單講就是拿空間換時間。複製算法的執行過程如下圖:
[img]http://dl2.iteye.com/upload/attachment/0120/3775/f4456210-3988-39ca-971b-9a236a9087ad.png[/img]
現在的商業虛擬機都採用這種收集算法來回收新生代,IBM公司的專門研究表明,新生代中的對象98%是“朝生夕死”的,所以並不需要按照1:1的比例來劃分內存空間,而是將內存分爲一塊兒較大的Eden空間和兩塊較小的Surivior空間,每次使用Eden和其中一塊兒Survivor空間上,最後清理掉Eden和剛纔用過的Survivor。當回收時,將Eden、和Survivor中還活着的對象一次性的複製到另一塊Survivor空間上,最後清理掉Eden和剛纔使用過的Survivor空間。Hotspot虛擬機默認的Eden和Survivor的大小比例是8:1,也就是每次新生代中可用內存空間爲整個新生代容量的90%(80%+10%),只有10%的內存會被“浪費”。當然,98%的對象可回收只是一般場景下的數據,我們沒有辦法保證每次回收都只有不多於10%的對象存活,但Survivor空間不夠用時,需要依賴其他內存(這裏指老年代)進行分配擔保(Handle Promotion)。
三、標記-整理算法
複製收集算法在對象存活率較高時就要進行較多的複製操作,效率將會變低。更關鍵的是,如果不想浪費50%的空間,就需要有額外的空間進行分配擔保,以應對被使用的內存中所有對象都100%存活的極端情況,所以在老年代中一般不能直接選用這種算法。
根據老年代的特點,新的“標記-整理”(Mark-Compact)算法出現了,標記過程仍然與“標記-清除”算法一樣,但後續步驟不是直接對可回收對象進行清理,而是讓所有存活的對象都向一端移動,然後直接清理掉端邊界以外的內存,“標記-整理”算法的示意圖如下所示
[img]http://dl2.iteye.com/upload/attachment/0120/3801/7640e266-fd32-3dea-bc31-24de4aa972f8.png[/img]
四、分代收集算法
當代商業虛擬機的垃圾收集器都採用“分代收集(Generational Collection)”算法,這種算法時根據對象存活週期的不同將內存劃分爲幾塊。一般是把java堆分爲新生代和老年代,這樣就可以根據各個年代的特點採用最適當的收集算法。在新生代中, 每次垃圾收集時都發現有大批對象死去,只有少量存活,那就選用複製算法,只需要付出少量存活對象的複製成本就可以完成收集。而老年代中因爲對象存活率高,沒有額外空間對它進行分配擔保,就必須使用“標記-整理”算法來進行回收。

參考文獻:《深入理解Java虛擬機:JVM高級特性與最佳實踐(第二版)》 周志明著
發佈了151 篇原創文章 · 獲贊 2 · 訪問量 1萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章