Jvm堆內存的劃分結構和優化,垃圾回收詳解

JVM中堆空間劃分如下圖所示


上圖中,刻畫了Java程序運行時的堆空間,可以簡述成如下2

1.JVM中堆空間可以分成三個大區,新生代、老年代、永久代

2.新生代可以劃分爲三個區,Eden區,兩個倖存區

在JVM運行時,可以通過配置以下參數改變整個JVM堆的配置比例

1.JVM運行時堆的大小

-Xms堆的最小值

-Xmx堆空間的最大值

2.新生代堆空間大小調整

-XX:NewSize新生代的最小值

-XX:MaxNewSize新生代的最大值

-XX:NewRatio設置新生代與老年代在堆空間的大小

-XX:SurvivorRatio新生代中Eden所佔區域的大小

3.永久代大小調整

-XX:MaxPermSize

4.其他

 -XX:MaxTenuringThreshold,設置將新生代對象轉到老年代時需要經過多少次垃圾回收,但是仍然沒有被回收

在上面的配置中,老年代所佔空間的大小是由-XX:SurvivorRatio這個參數進行配置的,看完了上面的JVM堆空間分配圖,可能會奇怪,爲啥新生代空間要劃分爲三個區Eden及兩個Survivor區?有何用意?爲什麼要這麼分?要理解這個問題,就得理解一下JVM的垃圾收集機制(複製算法也叫copy算法),步驟如下:

複製(Copying)算法

將內存平均分成AB兩塊,算法過程:

1. 新生對象被分配到A塊中未使用的內存當中。當A塊的內存用完了, 把A塊的存活對象對象複製到B塊。
2. 清理A塊所有對象。
3. 新生對象被分配的B塊中未使用的內存當中。當B塊的內存用完了, 把B塊的存活對象對象複製到A塊。
4. 清理B塊所有對象。
5. goto 1。

優點:簡單高效。缺點:內存代價高,有效內存爲佔用內存的一半。

圖解說明如下所示:(圖中後觀是一個循環過程)


對複製算法進一步優化:使用Eden/S0/S1三個分區

平均分成A/B塊太浪費內存,採用Eden/S0/S1三個區更合理,空間比例爲Eden:S0:S1==8:1:1,有效內存(即可分配新生對象的內存)是總內存的9/10

算法過程:

1. Eden+S0可分配新生對象;
2. 對Eden+S0進行垃圾收集,存活對象複製到S1。清理Eden+S0。一次新生代GC結束。
3. Eden+S1可分配新生對象;
4. 對Eden+S1進行垃圾收集,存活對象複製到S0。清理Eden+S1。二次新生代GC結束。
5. goto 1。

默認Eden:S0:S1=8:1:1,因此,新生代中可以使用的內存空間大小佔用新生代的9/10,那麼有人就會問,爲什麼不直接分成兩個區,一個區佔9/10,另一個區佔1/10,這樣做的原因大概有以下幾種

1.S0S1的區間明顯較小,有效新生代空間爲Eden+S0/S1,因此有效空間就大,增加了內存使用率
2.
有利於對象代的計算,當一個對象在S0/S1中達到設置的XX:MaxTenuringThreshold值後,會將其分到老年代中,設想一下,如果沒有S0/S1,直接分成兩個區,該如何計算對象經過了多少次GC還沒被釋放,你可能會說,在對象里加一個計數器記錄經過的GC次數,或者存在一張映射表記錄對象和GC次數的關係,是的,可以,但是這樣的話,會掃描整個新生代中的對象,有了S0/S1我們就可以只掃描S0/S1區了

1.1.       原理

JVM堆內存分爲2塊:Permanent Space Heap Space

  • Permanent 即 持久代(Permanent Generation),主要存放的是Java類定義信息,與垃圾收集器要收集的Java對象關係不大。
  • Heap = { Old + NEW = {Eden, from, to} },Old 即 年老代(Old Generation),New 即 年輕代(Young Generation)。年老代和年輕代的劃分對垃圾收集影響比較大。

1.1.1.年輕代

所有新生成的對象首先都是放在年輕代。年輕代的目標就是儘可能快速的收集掉那些生命週期短的對象。年輕代一般分3個區,1Eden區,2Survivor區(from to)。

大部分對象在Eden區中生成。當Eden區滿時,還存活的對象將被複制到Survivor區(兩個中的一個),當一個Survivor區滿時,此區的存活對象將被複制到另外一個Survivor區,當另一個Survivor區也滿了的時候,從前一個Survivor區複製過來的並且此時還存活的對象,將可能被複制到年老代。

2Survivor區是對稱的,沒有先後關係,所以同一個Survivor區中可能同時存在從Eden區複製過來對象,和從另一個Survivor區複製過來的對象;而複製到年老區的只有從另一個Survivor區過來的對象。而且,因爲需要交換的原因,Survivor區至少有一個是空的。特殊的情況下,根據程序需要,Survivor區是可以配置爲多個的(多於2個),這樣可以增加對象在年輕代中的存在時間,減少被放到年老代的可能。

針對年輕代的垃圾回收即Young GC

1.1.2.年老代

在年輕代中經歷了N次(可配置)垃圾回收後仍然存活的對象,就會被複制到年老代中。因此,可以認爲年老代中存放的都是一些生命週期較長的對象。

針對年老代的垃圾回收即Full GC

1.1.3.持久代

用於存放靜態類型數據,如Java Class, Method等。持久代對垃圾回收沒有顯著影響。但是有些應用可能動態生成或調用一些Class,例如Hibernate CGLib等,在這種時候往往需要設置一個比較大的持久代空間來存放這些運行過程中動態增加的類型。

 

所以,當一組對象生成時,內存申請過程如下

  1. JVM會試圖爲相關Java對象在年輕代的Eden區中初始化一塊內存區域。
  2. 當Eden區空間足夠時,內存申請結束。否則執行下一步。
  3. JVM試圖釋放在Eden區中所有不活躍的對象(Young GC)。釋放後若Eden空間仍然不足以放入新對象,JVM則試圖將部分Eden區中活躍對象放入Survivor區。
  4. Survivor區被用來作爲Eden區及年老代的中間交換區域。當年老代空間足夠時,Survivor區中存活了一定次數的對象會被移到年老代。
  5. 當年老代空間不夠時,JVM會在年老代進行完全的垃圾回收(Full GC)。
  6. Full GC後,若Survivor區及年老代仍然無法存放從Eden區複製過來的對象,則會導致JVM無法在Eden區爲新生成的對象申請內存,即出現“Out of Memory”。

OOM“Outof Memory”)異常一般主要有如下2種原因

1. 年老代溢出,表現爲:java.lang.OutOfMemoryError:Javaheapspace

這是最常見的情況,產生的原因可能是:設置的內存參數Xmx過小或程序的內存泄露及使用不當問題。

例如循環上萬次的字符串處理、創建上千萬個對象、在一段代碼內申請上百M甚至上G的內存。還有的時候雖然不會報內存溢出,卻會使系統不間斷的垃圾回收,也無法處理其它請求。這種情況下除了檢查程序、打印堆內存等方法排查,還可以藉助一些內存分析工具,比如MAT就很不錯。


2.
持久代溢出,表現爲:java.lang.OutOfMemoryError:PermGenspace

通常由於持久代設置過小,動態加載了大量Java類而導致溢出,解決辦法唯有將參數 -XX:MaxPermSize調大(一般256m能滿足絕大多數應用程序需求)。將部分Java類放到容器共享區(例如Tomcatshare lib)去加載的辦法也是一個思路,但前提是容器裏部署了多個應用,且這些應用有大量的共享類庫。

1.2.  參數說明

  • -Xmx3550m:設置JVM最大堆內存爲3550M。
  • -Xms3550m:設置JVM初始堆內存爲3550M。此值可以設置與-Xmx相同,以避免每次垃圾回收完成後JVM重新分配內存。
  • -Xss128k:設置每個線程的棧大小。JDK5.0以後每個線程棧大小爲1M,之前每個線程棧大小爲256K。應當根據應用的線程所需內存大小進行調整。在相同物理內存下,減小這個值能生成更多的線程。但是操作系統對一個進程內的線程數還是有限制的,不能無限生成,經驗值在3000~5000左右。需要注意的是:當這個值被設置的較大(例如>2MB)時將會在很大程度上降低系統的性能。
  • -Xmn2g:設置年輕代大小爲2G。在整個堆內存大小確定的情況下,增大年輕代將會減小年老代,反之亦然。此值關係到JVM垃圾回收,對系統性能影響較大,官方推薦配置爲整個堆大小的3/8。
  • -XX:NewSize=1024m:設置年輕代初始值爲1024M。
  • -XX:MaxNewSize=1024m:設置年輕代最大值爲1024M。
  • -XX:PermSize=256m:設置持久代初始值爲256M。
  • -XX:MaxPermSize=256m:設置持久代最大值爲256M。
  • -XX:NewRatio=4:設置年輕代(包括1個Eden和2個Survivor區)與年老代的比值。表示年輕代比年老代爲1:4。
  • -XX:SurvivorRatio=4:設置年輕代中Eden區與Survivor區的比值。表示2個Survivor區(JVM堆內存年輕代中默認有2個大小相等的Survivor區)與1個Eden區的比值爲2:4,即1個Survivor區佔整個年輕代大小的1/6。
  • -XX:MaxTenuringThreshold=7:表示一個對象如果在Survivor區(救助空間)移動了7次還沒有被垃圾回收就進入年老代。如果設置爲0的話,則年輕代對象不經過Survivor區,直接進入年老代,對於需要大量常駐內存的應用,這樣做可以提高效率。如果將此值設置爲一個較大值,則年輕代對象會在Survivor區進行多次複製,這樣可以增加對象在年輕代存活時間,增加對象在年輕代被垃圾回收的概率,減少Full GC的頻率,這樣做可以在某種程度上提高服務穩定性。

1.3.  疑問解答

-Xmn-XX:NewSize/-XX:MaxNewSize-XX:NewRatio3組參數都可以影響年輕代的大小,混合使用的情況下,優先級是什麼?
如下:

  1. 高優先級:-XX:NewSize/-XX:MaxNewSize 
  2. 中優先級:-Xmn(默認等效  -Xmn=-XX:NewSize=-XX:MaxNewSize=?) 
  3. 低優先級:-XX:NewRatio 

推薦使用-Xmn參數,原因是這個參數簡潔,相當於一次設定 NewSize/MaxNewSIze,而且兩者相等,適用於生產環境。-Xmn配合-Xms/-Xmx,即可將堆內存佈局完成。

-Xmn參數是在JDK 1.4開始支持。

 

1.4.       垃圾回收器選擇

JVM給出了3種選擇:串行收集器、並行收集器、併發收集器。串行收集器只適用於小數據量的情況,所以生產環境的選擇主要是並行收集器和併發收集器。

默認情況下JDK5.0以前都是使用串行收集器,如果想使用其他收集器需要在啓動時加入相應參數。JDK5.0以後,JVM會根據當前系統配置進行智能判斷。

1.4.1.   串行收集器

  • -XX:+UseSerialGC:設置串行收集器。

1.4.2.   並行收集器(吞吐量優先)

  • -XX:+UseParallelGC:設置爲並行收集器。此配置僅對年輕代有效。即年輕代使用並行收集,而年老代仍使用串行收集。
  • -XX:ParallelGCThreads=20:配置並行收集器的線程數,即:同時有多少個線程一起進行垃圾回收。此值建議配置與CPU數目相等。
  • -XX:+UseParallelOldGC:配置年老代垃圾收集方式爲並行收集。JDK6.0開始支持對年老代並行收集。
  • -XX:MaxGCPauseMillis=100:設置每次年輕代垃圾回收的最長時間(單位毫秒)。如果無法滿足此時間,JVM會自動調整年輕代大小,以滿足此時間。
  • -XX:+UseAdaptiveSizePolicy:設置此選項後,並行收集器會自動調整年輕代Eden區大小和Survivor區大小的比例,以達成目標系統規定的最低響應時間或者收集頻率等指標。此參數建議在使用並行收集器時,一直打開。

1.4.3.   併發收集器(響應時間優先)

  • -XX:+UseConcMarkSweepGC:即CMS收集,設置年老代爲併發收集。CMS收集是JDK1.4後期版本開始引入的新GC算法。它的主要適合場景是對響應時間的重要性需求大於對吞吐量的需求,能夠承受垃圾回收線程和應用線程共享CPU資源,並且應用中存在比較多的長生命週期對象。CMS收集的目標是儘量減少應用的暫停時間,減少Full GC發生的機率,利用和應用程序線程併發的垃圾回收線程來標記清除年老代內存。
  • -XX:+UseParNewGC:設置年輕代爲併發收集。可與CMS收集同時使用。JDK5.0以上,JVM會根據系統配置自行設置,所以無需再設置此參數。
  • -XX:CMSFullGCsBeforeCompaction=0:由於併發收集器不對內存空間進行壓縮和整理,所以運行一段時間並行收集以後會產生內存碎片,內存使用效率降低。此參數設置運行0次Full GC後對內存空間進行壓縮和整理,即每次Full GC後立刻開始壓縮和整理內存。
  • -XX:+UseCMSCompactAtFullCollection:打開內存空間的壓縮和整理,在Full GC後執行。可能會影響性能,但可以消除內存碎片。
  • -XX:+CMSIncrementalMode:設置爲增量收集模式。一般適用於單CPU情況。
  • -XX:CMSInitiatingOccupancyFraction=70:表示年老代內存空間使用到70%時就開始執行CMS收集,以確保年老代有足夠的空間接納來自年輕代的對象,避免Full GC的發生。

1.4.4.   其它垃圾回收參數

  • -XX:+ScavengeBeforeFullGC:年輕代GC優於Full GC執行。
  • -XX:-DisableExplicitGC:不響應 System.gc() 代碼。
  • -XX:+UseThreadPriorities:啓用本地線程優先級API。即使 java.lang.Thread.setPriority() 生效,不啓用則無效。
  • -XX:SoftRefLRUPolicyMSPerMB=0:軟引用對象在最後一次被訪問後能存活0毫秒(JVM默認爲1000毫秒)。
  • -XX:TargetSurvivorRatio=90:允許90%的Survivor區被佔用(JVM默認爲50%)。提高對於Survivor區的使用率。

1.5.       輔助信息參數設置

  • -XX:-CITime:打印消耗在JIT編譯的時間。
  • -XX:ErrorFile=./hs_err_pid.log:保存錯誤日誌或數據到指定文件中。
  • -XX:HeapDumpPath=./java_pid.hprof:指定Dump堆內存時的路徑。
  • -XX:-HeapDumpOnOutOfMemoryError:當首次遭遇內存溢出時Dump出此時的堆內存。
  • -XX:OnError=";":出現致命ERROR後運行自定義命令。
  • -XX:OnOutOfMemoryError=";":當首次遭遇內存溢出時執行自定義命令。
  • -XX:-PrintClassHistogram:按下 Ctrl+Break 後打印堆內存中類實例的柱狀信息,同JDK的 jmap -histo 命令。
  • -XX:-PrintConcurrentLocks:按下 Ctrl+Break 後打印線程棧中併發鎖的相關信息,同JDK的 jstack -l 命令。
  • -XX:-PrintCompilation:當一個方法被編譯時打印相關信息。
  • -XX:-PrintGC:每次GC時打印相關信息。
  • -XX:-PrintGCDetails:每次GC時打印詳細信息。
  • -XX:-PrintGCTimeStamps:打印每次GC的時間戳。
  • -XX:-TraceClassLoading:跟蹤類的加載信息。
  • -XX:-TraceClassLoadingPreorder:跟蹤被引用到的所有類的加載信息。
  • -XX:-TraceClassResolution:跟蹤常量池。
  • -XX:-TraceClassUnloading:跟蹤類的卸載信息。

1.6.       關於參數名稱等

  • 標準參數(-),所有JVM都必須支持這些參數的功能,而且向後兼容;例如:
    • -client——設置JVM使用Client模式,特點是啓動速度比較快,但運行時性能和內存管理效率不高,通常用於客戶端應用程序或開發調試;在32位環境下直接運行Java程序默認啓用該模式。
    • -server——設置JVM使Server模式,特點是啓動速度比較慢,但運行時性能和內存管理效率很高,適用於生產環境。在具有64位能力的JDK環境下默認啓用該模式。
  • 非標準參數(-X),默認JVM實現這些參數的功能,但是並不保證所有JVM實現都滿足,且不保證向後兼容;
  • 非穩定參數(-XX),此類參數各個JVM實現會有所不同,將來可能會不被支持,需要慎重使用;
發佈了37 篇原創文章 · 獲贊 20 · 訪問量 12萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章