點滴：Java JVM垃圾回收機制

1.JVM的gc概述

　　gc即垃圾收集機制是指jvm用於釋放那些不再使用的對象所佔用的內存。java語言並不要求jvm有gc，也沒有規定gc如何工作。不過常用的jvm都有gc，而且大多數gc都使用類似的算法管理內存和執行收集操作。

　　在充分理解了垃圾收集算法和執行過程後，纔能有效的優化它的性能。有些垃圾收集專用於特殊的應用程序。比如，實時應用程序主要是爲了避免垃圾收集中斷，而大多數OLTP應用程序則注重整體效率。理解了應用程序的工作負荷和jvm支持的垃圾收集算法，便可以進行優化配置垃圾收集器。

　　垃圾收集的目的在於清除不再使用的對象。gc通過確定對象是否被活動對象引用來確定是否收集該對象。gc首先要判斷該對象是否是時候可以收集。兩種常用的方法是引用計數和對象引用遍歷。

1.1.引用計數
　　引用計數存儲對特定對象的所有引用數，也就是說，當應用程序創建引用以及引用超出範圍時，jvm必須適當增減引用數。當某對象的引用數爲0時，便可以進行垃圾收集。

1.2.對象引用遍歷
　　早期的jvm使用引用計數，現在大多數jvm採用對象引用遍歷。對象引用遍歷從一組對象開始，沿着整個對象圖上的每條鏈接，遞歸確定可到達（reachable）的對象。如果某對象不能從這些根對象的一個（至少一個）到達，則將它作爲垃圾收集。在對象遍歷階段，gc必須記住哪些對象可以到達，以便刪除不可到達的對象，這稱爲標記（marking）對象。

　　下一步，gc要刪除不可到達的對象。刪除時，有些gc只是簡單的掃描堆棧，刪除未標記的未標記的對象，並釋放它們的內存以生成新的對象，這叫做清除（sweeping）。這種方法的問題在於內存會分成好多小段，而它們不足以用於新的對象，但是組合起來卻很大。因此，許多gc可以重新組織內存中的對象，並進行壓縮（compact），形成可利用的空間。

　　爲此，gc需要停止其他的活動活動。這種方法意味着所有與應用程序相關的工作停止，只有gc運行。結果，在響應期間增減了許多混雜請求。另外，更復雜的gc不斷增加或同時運行以減少或者清除應用程序的中斷。有的gc使用單線程完成這項工作，有的則採用多線程以增加效率。

2回頂部

2.幾種垃圾回收機制

2.1.標記－清除收集器
　　這種收集器首先遍歷對象圖並標記可到達的對象，然後掃描堆棧以尋找未標記對象並釋放它們的內存。這種收集器一般使用單線程工作並停止其他操作。

2.2.標記－壓縮收集器
　　有時也叫標記－清除－壓縮收集器，與標記－清除收集器有相同的標記階段。在第二階段，則把標記對象複製到堆棧的新域中以便壓縮堆棧。這種收集器也停止其他操作。

2.3.複製收集器
　　這種收集器將堆棧分爲兩個域，常稱爲半空間。每次僅使用一半的空間，jvm生成的新對象則放在另一半空間中。gc運行時，它把可到達對象複製到另一半空間，從而壓縮了堆棧。這種方法適用於短生存期的對象，持續複製長生存期的對象則導致效率降低。

2.4.增量收集器
　　增量收集器把堆棧分爲多個域，每次僅從一個域收集垃圾。這會造成較小的應用程序中斷。

2.5.分代收集器
　　這種收集器把堆棧分爲兩個或多個域，用以存放不同壽命的對象。jvm生成的新對象一般放在其中的某個域中。過一段時間，繼續存在的對象將獲得使用期並轉入更長壽命的域中。分代收集器對不同的域使用不同的算法以優化性能。

2.6.併發收集器
　　併發收集器與應用程序同時運行。這些收集器在某點上（比如壓縮時）一般都不得不停止其他操作以完成特定的任務，但是因爲其他應用程序可進行其他的後臺操作，所以中斷其他處理的實際時間大大降低。

2.7.並行收集器
　　並行收集器使用某種傳統的算法並使用多線程並行的執行它們的工作。在多cpu機器上使用多線程技術可以顯著的提高java應用程序的可擴展性。

3回頂部

3.Sun HotSpot 1.4.1 JVM堆大小的調整

　　Sun HotSpot 1.4.1使用分代收集器，它把堆分爲三個主要的域：新域、舊域以及永久域。Jvm生成的所有新對象放在新域中。一旦對象經歷了一定數量的垃圾收集循環後，便獲得使用期並進入舊域。在永久域中jvm則存儲class和method對象。就配置而言，永久域是一個獨立域並且不認爲是堆的一部分。

　　下面介紹如何控制這些域的大小。可使用-Xms和-Xmx 控制整個堆的原始大小或最大值。

　　下面的命令是把初始大小設置爲128M：
　　java –Xms128m
　　–Xmx256m爲控制新域的大小，可使用-XX:NewRatio設置新域在堆中所佔的比例。

　　下面的命令把整個堆設置成128m，新域比率設置成3，即新域與舊域比例爲1：3，新域爲堆的1/4或32M：
　　java –Xms128m –Xmx128m
　　–XX:NewRatio =3可使用-XX:NewSize和-XX:MaxNewsize設置新域的初始值和最大值。

　　下面的命令把新域的初始值和最大值設置成64m:
　　java –Xms256m –Xmx256m –Xmn64m
　　永久域默認大小爲4m。運行程序時，jvm會調整永久域的大小以滿足需要。每次調整時，jvm會對堆進行一次完全的垃圾收集。

　　使用-XX:MaxPerSize標誌來增加永久域搭大小。在WebLogic Server應用程序加載較多類時，經常需要增加永久域的最大值。當jvm加載類時，永久域中的對象急劇增加，從而使jvm不斷調整永久域大小。爲了避免調整，可使用-XX:PerSize標誌設置初始值。

　　下面把永久域初始值設置成32m，最大值設置成64m。
　　java -Xms512m -Xmx512m -Xmn128m -XX:PermSize=32m -XX:MaxPermSize=64m

　　默認狀態下，HotSpot在新域中使用複製收集器。該域一般分爲三個部分。第一部分爲Eden，用於生成新的對象。另兩部分稱爲救助空間，當Eden充滿時，收集器停止應用程序，把所有可到達對象複製到當前的from救助空間，一旦當前的from救助空間充滿，收集器則把可到達對象複製到當前的to救助空間。From和to救助空間互換角色。維持活動的對象將在救助空間不斷複製，直到它們獲得使用期並轉入舊域。使用-XX:SurvivorRatio可控制新域子空間的大小。

　　同NewRation一樣，SurvivorRation規定某救助域與Eden空間的比值。比如，以下命令把新域設置成64m，Eden佔32m，每個救助域各佔16m：
　　java -Xms256m -Xmx256m -Xmn64m -XX:SurvivorRation =2

4回頂部

　　如前所述，默認狀態下HotSpot對新域使用複製收集器，對舊域使用標記－清除－壓縮收集器。在新域中使用複製收集器有很多意義，因爲應用程序生成的大部分對象是短壽命的。理想狀態下，所有過渡對象在移出Eden空間時將被收集。如果能夠這樣的話，並且移出Eden空間的對象是長壽命的，那麼理論上可以立即把它們移進舊域，避免在救助空間反覆複製。但是，應用程序不能適合這種理想狀態，因爲它們有一小部分中長壽命的對象。最好是保持這些中長壽命的對象並放在新域中，因爲複製小部分的對象總比壓縮舊域廉價。爲控制新域中對象的複製，可用-XX:TargetSurvivorRatio控制救助空間的比例（該值是設置救助空間的使用比例。如救助空間位1M，該值50表示可用500K）。該值是一個百分比，默認值是50。當較大的堆棧使用較低的sruvivorratio時，應增加該值到80至90，以更好利用救助空間。用-XX:maxtenuring threshold可控制上限。

　　爲放置所有的複製全部發生以及希望對象從eden擴展到舊域，可以把MaxTenuring Threshold設置成0。設置完成後，實際上就不再使用救助空間了，因此應把SurvivorRatio設成最大值以最大化Eden空間，設置如下：
　　java … -XX:MaxTenuringThreshold=0 –XX:SurvivorRatio＝50000 …

4.BEA JRockit JVM的使用
　　Bea WebLogic 8.1使用的新的JVM用於Intel平臺。在Bea安裝完畢的目錄下可以看到有一個類似於jrockit81sp1_141_03的文件夾。這就是Bea新JVM所在目錄。不同於HotSpot把Java字節碼編譯成本地碼，它預先編譯成類。JRockit還提供了更細緻的功能用以觀察JVM的運行狀態，主要是獨立的GUI控制檯（只能適用於使用Jrockit才能使用jrockit81sp1_141_03自帶的console監控一些cpu及memory參數）或者WebLogic Server控制檯。

　　Bea JRockit JVM支持4種垃圾收集器：
　　4.1.1.分代複製收集器
　　它與默認的分代收集器工作策略類似。對象在新域中分配，即JRockit文檔中的nursery。這種收集器最適合單cpu機上小型堆操作。

　　4.1.2.單空間併發收集器
　　該收集器使用完整堆，並與背景線程共同工作。儘管這種收集器可以消除中斷，但是收集器需花費較長的時間尋找死對象，而且處理應用程序時收集器經常運行。如果處理器不能應付應用程序產生的垃圾，它會中斷應用程序並關閉收集。

　　分代併發收集器這種收集器在護理域使用排它複製收集器，在舊域中則使用併發收集器。由於它比單空間共同發生收集器中斷頻繁，因此它需要較少的內存，應用程序的運行效率也較高，注意，過小的護理域可以導致大量的臨時對象被擴展到舊域中。這會造成收集器超負荷運作，甚至採用排它性工作方式完成收集。

　　4.1.3.並行收集器
　　該收集器也停止其他進程的工作，但使用多線程以加速收集進程。儘管它比其他的收集器易於引起長時間的中斷，但一般能更好的利用內存，程序效率也較高。

　　默認狀態下，JRockit使用分代併發收集器。要改變收集器，可使用-Xgc:，對應四個收集器分別爲gencopy，singlecon，gencon以及parallel。可使用-Xms和-Xmx設置堆的初始大小和最大值。要設置護理域，則使用-Xns:java –jrockit –Xms512m –Xmx512m –Xgc:gencon –Xns128m…儘管JRockit支持-verbose:gc開關，但它輸出的信息會因收集器的不同而異。JRockit還支持memory、load和codegen的輸出。

　　注意：如果使用JRockit JVM的話還可以使用WLS自帶的console（C:\bea\jrockit81sp1_141_03\bin下）來監控一些數據，如cpu，memery等。要想能構監控必須在啓動服務時startWeblogic.cmd中加入－Xmanagement參數。

5回頂部

5.如何從JVM中獲取信息來進行調整

　　-verbose.gc開關可顯示gc的操作內容。打開它，可以顯示最忙和最空閒收集行爲發生的時間、收集前後的內存大小、收集需要的時間等。打開-xx:+ printgcdetails開關，可以詳細瞭解gc中的變化。打開-XX: + PrintGCTimeStamps開關，可以瞭解這些垃圾收集發生的時間，自jvm啓動以後以秒計量。最後，通過-xx: + PrintHeapAtGC開關了解堆的更詳細的信息。爲了瞭解新域的情況，可以通過-XX:=PrintTenuringDistribution開關了解獲得使用期的對象權。

6.Pdm系統JVM調整

　　6.1.服務器：前提內存1G 單CPU

　　可通過如下參數進行調整：－server 啓用服務器模式（如果CPU多，服務器機建議使用此項）

　　－Xms,－Xmx一般設爲同樣大小。 800m
　　－Xmn 是將NewSize與MaxNewSize設爲一致。320m
　　－XX:PerSize 64m
　　－XX:NewSize 320m 此值設大可調大新對象區，減少Full GC次數
　　－XX:MaxNewSize 320m
　　－XX:NewRato NewSize設了可不設。4
　　－XX: SurvivorRatio 4
　　－XX:userParNewGC 可用來設置並行收集
　　－XX:ParallelGCThreads 可用來增加並行度 4
　　－XXUseParallelGC 設置後可以使用並行清除收集器
　　－XX：UseAdaptiveSizePolicy 與上面一個聯合使用效果更好，利用它可以自動優化新域大小以及救助空間比值

　　6.2.客戶機：通過在JNLP文件中設置參數來調整客戶端JVM

　　JNLP中參數：initial-heap-size和max-heap-size

　　這可以在framework的RequestManager中生成JNLP文件時加入上述參數，但是這些值是要求根據客戶機的硬件狀態變化的（如客戶機的內存大小等）。建議這兩個參數值設爲客戶機可用內存的60％（有待測試）。爲了在動態生成JNLP時以上兩個參數值能夠隨客戶機不同而不同，可靠慮獲得客戶機系統信息並將這些嵌到首頁index.jsp中作爲連接請求的參數。

　　在設置了上述參數後可以通過Visualgc 來觀察垃圾回收的一些參數狀態，再做相應的調整來改善性能。一般的標準是減少fullgc的次數，最好硬件支持使用並行垃圾回收（要求多CPU）

VM使用的是分代垃圾回收的方式，可以將Java對象分爲"年輕"對象和"年老"對象，JVM將內存堆（Heap）分爲兩個區域，一個是"年輕"區，另一個是"老"區，Java將這兩個區域分別稱作是"新生代"和"老生代".

    JVM垃圾回收的相關知識

    JVM使用的是分代垃圾回收的方式，主要是因爲在程序運行的時候會有如下特點：

    ◆大多數對象在創建後很快就沒有對象使用它了。

    ◆大多數在一直被使用的對象很少再去引用新創建的對象。

    因此就將Java對象分爲"年輕"對象和"年老"對象，JVM將內存堆（Heap）分爲兩個區域，一個是"年輕"區，另一個是"老"區，Java將這兩個區域分別稱作是"新生代"和"老生代".

    "新生代"區域中，絕大多數新創建的對象都存放在這個區域裏，此區域一般來說較小而且JVM垃圾回收頻率較高，同時因爲"新生代"採用的算法和其存放的對象的特點，使該區域JVM垃圾回收的效率也非常高。

    而"老生代"區域中存放的是在"新生代"中生存了較長時間的對象，這些對象將被轉移到"老生代"區。這個區域一般要大一些而且增長的速度相對於"新生代"要慢一些，"老生代"JVM垃圾回收的執行頻率也會低很多。

    由於JVM在JVM垃圾回收處理時會消耗一定的系統資源，因此有時候通過JVM啓動的時候添加相關參數來控制"新生代"區域的大小，來調整JVM垃圾回收處理的頻率非常有用。以便於我們更合理的利用系統資源。

    "新生代"區域設置參數是"-Xmn",用這個參數可以制定"新生代"區域的大小。

    我們來舉一個例子說明：

    我們就用系統自帶的程序作爲例子，在命令行上鍵入如下指令：

    CDC:\java\demo\jfc\SwingSet2[回車]C:\java\demo\jfc\SwingSet2>

    java-jar-verbose:gc-Xmn4mXX:+PrintGCDetailsSwingSet2.jar[回車]

    上面加入了一個新的參數"XX:+PrintGCDetails",這個參數能夠打印出GC的詳細信息。屏幕輸出如下（節選）：

    [GC[DefNew:3469K->84K（3712K），0.0007778secs]23035K->

    19679K（28728K），0.0009191secs][GC[DefNew:3284K->

    171K（3712K），0.0007283secs]22878K->

    19766K（28728K），0.0008669secs][GC[DefNew:3476K->

    260K（3712K），0.0008504secs]23071K->

    19855K（28728K），0.0009862secs][GC[DefNew:3502K->

    87K（3712K），0.0009267secs]23096K->

    19682K（28728K），0.0010610secs]

    我們需要解釋一下輸出的詳細內容的意思，拿第一行輸出來說：

    "DefNew:3469K->84K（3712K），0.0007778secs"是指"新生代"的JVM垃圾回收情況，這裏的意思是從佔用3469K內存空間變爲84K內存空間，用時0.0007778秒。

    "23035K->19679K（28728K），0.0009191secs"是指總體GC的回收情況，整體堆空間佔用從23035K降低到19679K的水平，用時0.0009191秒。

    那麼，這時候我們在將"新生代"的內存設爲8M,並把堆的最大可控值設定爲32M,再去執行，鍵入如下指令：

    java-jar-verbose:gc-Xmn8m-Xmx32mXX:+PrintGCDetailsSwingSet2.jar[回車]

    得到的結果如下（節選）：

    [GC[DefNew:6633K->6633K（7424K），0.0000684secs]

    [Tenured:18740K->18820K（24576K），0.0636505secs]25374K->

    18820K（32000K），0.0639274secs][GC[DefNew:6646K->

    6646K（7424K），0.0002581secs][Tenured:18820K->

    18884K（24576K），0.0651957secs]25467K->

    18884K（32000K），0.0658804secs][GC[DefNew:6611K->

    6611K（7424K），0.0000668secs][Tenured:18884K->

    18505K（24576K），0.0931406secs]25496K->

    18505K（32000K），0.0934295secs]

    這個結果說明：

    "[DefNew:6633K->6633K（7424K），0.0000684secs]"是指"新生代"的JVM垃圾回收情況，這裏的意思是從佔用6633K內存空間變爲6633K內存空間，用時0.0000684秒。

    "25374K->18820K（32000K），0.0639274secs"是指總體GC的回收情況，整體堆空間佔用從25374K降低到18820K的水平，用時0.0639274秒。

    "[Tenured:18740K->18820K（24576K），0.0636505secs]"是指"老生代"GC的回收情況，整體堆空間佔用從18740K降低到18820K的水平，用時0.0009012秒。

    通過這些參數的調整我們可以看到在處理垃圾收集問題時，從JVM垃圾回收的頻率是時間方面的變化，我們可以根據不同程序的不同情況予以調整。

    最後有必要提一下GC的相關參數：

    -XX:+PrintGCDetails顯示GC的詳細信息

    -XX:+PrintGCApplicationConcurrentTime打印應用執行的時間

    -XX:+PrintGCApplicationStoppedTime打印應用被暫停的時間

    注：":"後的"+"號表示開啓此選項，如果是"-"號那麼表示關閉此選項。