JVM Garbage First(G1)

1. 概述

G1(Garbage First)垃圾收集器是當今垃圾回收技術最前沿的成果之一。早在JDK7就已加入JVM的收集器大家庭中,成爲HotSpot重點發展的垃圾回收技術。同優秀的CMS垃圾回收器一樣,G1也是關注最小時延的垃圾回收器。

G1最大的特點是引入分區的思路,弱化了分代的概念,合理利用垃圾收集各個週期的資源,解決了其他收集器甚至CMS的衆多缺陷。

Top

2. G1

2.1 特點

開啓方式:-XX:+UseG1GC

串行、並行、CMS等收集器有如下共同點:

(1)年輕代、老年代是獨立且連續的內存塊;

(2)年輕代收集使用單Eden、雙Survivor進行復制算法;

(3)老年代收集必須掃描整個老年代區域;

(4)都是以儘可能少而快執行GC爲設計原則。

G1也有類似CMS的收集動作:初始標記、併發標記、重新標記、清除、轉移回收(Region),並且也以一個串行收集器做擔保機制。

G1的特點如下:

(1)G1的設計原則是“首先收集儘可能多的垃圾(Garbage First,名稱的由來)”。因此,G1並不會等內存耗盡(串行、並行)或者快耗盡(CMS)的時候開始垃圾收集,而是在內部採用了啓發式算法,在老年代找出具有高收集收益的分區進行收集。同時G1可以根據用戶設置的暫停時間目標自動調整年輕代和總堆大小,暫停目標越短年輕代空間越小、總空間就越大;

(2)G1採用內存分區(Region)的思路,將內存劃分爲一個個相等大小的內存分區,回收時則以分區爲單位進行回收,存活的對象複製到另一個空閒分區中。由於都是以相等大小的分區爲單位進行操作,因此G1天然就是一種壓縮方案(局部壓縮);

(3)G1雖然也是分代收集器,但整個內存分區不存在物理上的年輕代與老年代的區別,也不需要完全獨立的survivor(to space)堆做複製準備。G1只有邏輯上的分代概念,或者說每個分區都可能隨G1的運行在不同代之間前後切換;

(4)G1收集都是STW的,但年輕代和老年代的收集界限比較模糊,採用了混合(mixed)收集的方式。即每次收集既可能只收集年輕代分區(年輕代收集),也可能在收集年輕代的同時,包含部分老年代分區(混合收集),這樣即使堆內存很大時,也可以限制收集範圍,從而降低停頓。

2.2 G1內存模型

2.2.1 分區Region

G1採用分區(Region)的思路,將整個堆空間分成若干個大小相等的內存區域,每次分配對象空間將逐段使用內存。因此,在堆的使用上,G1並不要求對象的存儲一定是物理上連續的,只要邏輯上連續即可;每個分區也不會確定爲某個代(年輕代、老年代)服務,可以按需在年輕代和老年代之間切換。參數-XX:G1HeapRegionSize=n可指定分區大小(1MB~32MB,必須是2的冪),默認將整個堆劃分爲2048個分區。

 

2.2.2 卡片Card

在每個分區內部被分成了若干個大小爲512byte卡片(Card),標識堆內存最小可用粒度所有分區的卡片將會記錄在全局卡片表(Global Card Table)中,分配的對象會佔用物理上連續的若干個卡片,當查找對分區內對象的引用時便可通過記錄卡片來查找該引用對象。每次對內存的回收,都是對指定分區的卡片進行處理。

2.2.3 堆Heap

G1同樣可以通過-Xms、-Xmx指定堆空間大小,當發生年輕代收集或混合收集時,通過計算GC與應用的耗費時間比,自動調整堆空間大小。如果GC頻率太高,則通過增加堆尺寸,來減少GC頻率,相應地GC佔用的時間也隨之降低;目標參數-XX:GCTimeRatio即爲GC與應用的耗費的時間比,G1默認爲9。另外,當空間不足,如對象空間分配或轉移失敗時,G1會先嚐試增加堆空間,如果擴容失敗,則發起擔保的Full GC。Full GC後,堆尺寸計算結果也會調整堆空間。

2.3 分代模型

2.3.2 分代

分代垃圾收集可以將關注點集中在最近被分配的對象上,而無需整堆掃描,避免長命對象的拷貝,同時獨立收集有助於降低響應時間。雖然分區使得內存分配不再要求緊湊的內存空間,但G1依然使用了分代的思想。G1強內存在邏輯上劃分爲年輕代和老年代,其中年輕代又劃分爲Eden空間和Survivor空間。當年輕代空間並不是固定不變的,當現有年輕代分區佔滿時,JVM會分配新的空閒分區加入到年輕代空間。

整個年輕代內存會在初始空間-XX:G1NewSizePercent(默認整堆5%)與最大空間-XX:G1MaxNewSizePercent(默認60%)之間動態變化。且由參數目標暫停時間-XX:MaxGCPauseMillis(默認200ms)、需要擴縮的大小以及分區的RSet計算得到。當然G1依然可以設置固定的年輕代大小(-XX:NewRatio、-Xmn),但同時暫停目標將失去意義。

2.4 分區模型

G1堆內存的使用以分區(Region)爲單位,而對對象的分配則以卡片(Card)爲單位。

2.4.1 巨型對象(Humongous Region)

一個大小達到甚至超過分區大小一半的對象稱爲巨型對象(Humongous Object)。

當線程爲巨型分配空間時,不能簡單在TLAB進行分配,因爲巨型對象的移動成本很高,而且有可能一個分區不能容納巨型對象。因此,巨型對象會直接在老年代分配,所佔用的連續空間稱爲巨型分區(Humongous Region)。G1內部做了一個優化,一旦發現沒有引用指向巨型對象,則可直接在年輕代收集週期中被回收。

巨型對象會獨佔一個、或多個連續分區,其中第一個分區被標記爲開始巨型(StartsHumongous),相鄰連續分區被標記爲連續巨型(ContinuesHumongous)。由於無法享受Lab帶來的優化,並且確定一片連續的內存空間需要掃描整堆,因此確定巨型對象開始位置的成本非常高,如果可以,應用程序應避免生成巨型對象。

2.4.2 記憶集合(Remember Set,RSet)

在串行和並行收集器中,GC通過整堆掃描,來確定對象是否處於可達路徑中。然而G1爲了避免STW式的整堆掃描,在每個分區記錄了一個已記憶集合(RSet),內部類似一個反向指針,記錄引用分區內對象的卡片索引。當要回收該分區時,通過掃描分區的RSet,來確定引用本分區內的對象是否存活,進而確定本分區內的對象存活情況。

事實上,並非所有的引用都需要記錄在RSet中,如果一個分區確定需要掃描,那麼無需RSet也可以無遺漏的得到引用關係。那麼引用源自本分區的對象,當然不用落入RSet中;同時,G1 GC每次都會對年輕代進行整體收集,因此引用源自年輕代的對象,也不需要在RSet中記錄。最後只有老年代的分區可能會有RSet記錄,這些分區稱爲擁有RSet分區(an RSet’s owning region)。

2.4.3 收集集合(Collect Set,CSet)

收集集合(CSet)代表每次GC暫停時回收的一系列目標分區。在任意一次收集暫停中,CSet所有分區都會被釋放,內部存活的對象都會被轉移到分配的空閒分區中。因此無論是年輕代收集,還是混合收集,工作的機制都是一致的。年輕代收集CSet只容納年輕代分區,而混合收集會通過啓發式算法,在老年代候選回收分區中,篩選出回收收益最高的分區添加到CSet中。

候選老年代分區的CSet准入條件,可以通過活躍度閾值-XX:G1MixedGCLiveThresholdPercent(默認85%)進行設置,從而攔截那些回收開銷巨大的對象;同時,每次混合收集可以包含候選老年代分區,可根據CSet對堆的總大小佔比-XX:G1OldCSetRegionThresholdPercent(默認10%)設置數量上限。

由上述可知,G1的收集都是根據CSet進行操作的,年輕代收集與混合收集沒有明顯的不同,最大的區別在於兩種收集的觸發條件。

2.4.4 年輕代收集集合

年輕代收集集合 CSet of Young Collection:應用線程不斷活動後,年輕代空間會被逐漸填滿。當JVM分配對象到Eden區域失敗(Eden區已滿)時,便會觸發一次STW式的年輕代收集。在年輕代收集中,Eden分區存活的對象將被拷貝到Survivor分區;原有Survivor分區存活的對象,將根據任期閾值(tenuring threshold)分別晉升到PLAB中,新的survivor分區和老年代分區。而原有的年輕代分區將被整體回收掉。

同時,年輕代收集還負責維護對象的年齡(存活次數),輔助判斷老化(tenuring)對象晉升的時候是到Survivor分區還是到老年代分區。年輕代收集首先先將晉升對象尺寸總和、對象年齡信息維護到年齡表中,再根據年齡表、Survivor尺寸、Survivor填充容量-XX:TargetSurvivorRatio(默認50%)、最大任期閾值-XX:MaxTenuringThreshold(默認15),計算出一個恰當的任期閾值,凡是超過任期閾值的對象都會被晉升到老年代。

2.4.5 混合收集集合

混合收集集合 CSet of Mixed Collection:年輕代收集不斷活動後,老年代的空間也會被逐漸填充。當老年代佔用空間超過整堆比IHOP閾值-XX:InitiatingHeapOccupancyPercent(默認45%)時,G1就會啓動一次混合垃圾收集週期。爲了滿足暫停目標,G1可能不能一口氣將所有的候選分區收集掉,因此G1可能會產生連續多次的混合收集與應用線程交替執行,每次STW的混合收集與年輕代收集過程相類似。

爲了確定包含到年輕代收集集合CSet的老年代分區,JVM通過參數混合週期的最大總次數-XX:G1MixedGCCountTarget(默認8)、堆廢物百分比-XX:G1HeapWastePercent(默認5%)。通過候選老年代分區總數與混合週期最大總次數,確定每次包含到CSet的最小分區數量;根據堆廢物百分比,當收集達到參數時,不再啓動新的混合收集。而每次添加到CSet的分區,則通過計算得到的GC效率進行安排。

2.5 G1的收集週期

RSet的維護
由於不能整堆掃描,又需要計算分區確切的活躍度,因此,G1需要一個增量式的完全標記併發算法,通過維護RSet,得到準確的分區引用信息。在G1中,RSet的維護主要來源兩個方面:寫柵欄(Write Barrier)和併發優化線程(Concurrence Refinement Threads)

柵欄


柵欄 Barrier

我們首先介紹一下柵欄(Barrier)的概念。柵欄是指在原生代碼片段中,當某些語句被執行時,柵欄代碼也會被執行。而G1主要在賦值語句中,使用寫前柵欄(Pre-Write Barrrier)和寫後柵欄(Post-Write Barrrier)。事實上,寫柵欄的指令序列開銷非常昂貴,應用吞吐量也會根據柵欄複雜度而降低。

寫前柵欄 Pre-Write Barrrier

即將執行一段賦值語句時,等式左側對象將修改引用到另一個對象,那麼等式左側對象原先引用的對象所在分區將因此喪失一個引用,那麼JVM就需要在賦值語句生效之前,記錄喪失引用的對象。JVM並不會立即維護RSet,而是通過批量處理,在將來RSet更新(見SATB)。

寫後柵欄 Post-Write Barrrier

當執行一段賦值語句後,等式右側對象獲取了左側對象的引用,那麼等式右側對象所在分區的RSet也應該得到更新。同樣爲了降低開銷,寫後柵欄發生後,RSet也不會立即更新,同樣只是記錄此次更新日誌,在將來批量處理(見Concurrence Refinement Threads)。

起始快照算法
起始快照算法 Snapshot at the beginning (SATB)

Taiichi Tuasa貢獻的增量式完全併發標記算法起始快照算法(SATB),主要針對標記-清除垃圾收集器的併發標記階段,非常適合G1的分區塊的堆結構,同時解決了CMS的主要煩惱:重新標記暫停時間長帶來的潛在風險。

SATB會創建一個對象圖,相當於堆的邏輯快照,從而確保併發標記階段所有的垃圾對象都能通過快照被鑑別出來。當賦值語句發生時,應用將會改變了它的對象圖,那麼JVM需要記錄被覆蓋的對象。因此寫前柵欄會在引用變更前,將值記錄在SATB日誌或緩衝區中。每個線程都會獨佔一個SATB緩衝區,初始有256條記錄空間。當空間用盡時,線程會分配新的SATB緩衝區繼續使用,而原有的緩衝去則加入全局列表中。最終在併發標記階段,併發標記線程(Concurrent Marking Threads)在標記的同時,還會定期檢查和處理全局緩衝區列表的記錄,然後根據標記位圖分片的標記位,掃描引用字段來更新RSet。此過程又稱爲併發標記/SATB寫前柵欄。
 

併發優化線程
併發優化線程 Concurrence Refinement Threads

G1中使用基於Urs Hölzle的快速寫柵欄,將柵欄開銷縮減到2個額外的指令。柵欄將會更新一個card table type的結構來跟蹤代間引用。

當賦值語句發生後,寫後柵欄會先通過G1的過濾技術判斷是否是跨分區的引用更新,並將跨分區更新對象的卡片加入緩衝區序列,即更新日誌緩衝區或髒卡片隊列。與SATB類似,一旦日誌緩衝區用盡,則分配一個新的日誌緩衝區,並將原來的緩衝區加入全局列表中。

併發優化線程(Concurrence Refinement Threads),只專注掃描日誌緩衝區記錄的卡片來維護更新RSet,線程最大數目可通過-XX:G1ConcRefinementThreads(默認等於-XX:ParellelGCThreads)設置。併發優化線程永遠是活躍的,一旦發現全局列表有記錄存在,就開始併發處理。如果記錄增長很快或者來不及處理,那麼通過閾值-X:G1ConcRefinementGreenZone/-XX:G1ConcRefinementYellowZone/-XX:G1ConcRefinementRedZone,G1會用分層的方式調度,使更多的線程處理全局列表。如果併發優化線程也不能跟上緩衝區數量,則Mutator線程(Java應用線程)會掛起應用並被加進來幫助處理,直到全部處理完。因此,必須避免此類場景出現。
 

2.5.1 併發標記週期

併發標記週期是G1中非常重要的階段,這個階段將會爲混合收集週期識別垃圾最多的老年代分區。整個週期完成根標記、識別所有(可能)存活對象,並計算每個分區的活躍度,從而確定GC效率等級。

當達到IHOP閾值-XX:InitiatingHeapOccupancyPercent(老年代佔整堆比,默認45%)時,便會觸發併發標記週期。整個併發標記週期將由初始標記(Initial Mark)、根分區掃描(Root Region Scanning)、併發標記(Concurrent Marking)、重新標記(Remark)、清除(Cleanup)幾個階段組成。其中,初始標記(隨年輕代收集一起活動)、重新標記、清除是STW的,而併發標記如果來不及標記存活對象,則可能在併發標記過程中,G1又觸發了幾次年輕代收集。

併發標記線程

併發標記線程 Concurrent Marking Threads

要標記存活的對象,每個分區都需要創建位圖(Bitmap)信息來存儲標記數據,來確定標記週期內被分配的對象。G1採用了兩個位圖Previous Bitmap、Next Bitmap,來存儲標記數據,Previous位圖存儲上次的標記數據,Next位圖在標記週期內不斷變化更新,同時Previous位圖的標記數據也越來越過時,當標記週期結束後Next位圖便替換Previous位圖,成爲上次標記的位圖。同時,每個分區通過頂部開始標記(TAMS),來記錄已標記過的內存範圍。同樣的,G1使用了兩個頂部開始標記Previous TAMS(PTAMS)、Next TAMS(NTAMS),記錄已標記的範圍。

在併發標記階段,G1會根據參數-XX:ConcGCThreads(默認GC線程數的1/4,即-XX:ParallelGCThreads/4),分配併發標記線程(Concurrent Marking Threads),進行標記活動。每個併發線程一次只掃描一個分區,並通過"手指"指針的方式優化獲取分區。併發標記線程是爆發式的,在給定的時間段拼命幹活,然後休息一段時間,再拼命幹活。

每個併發標記週期,在初始標記STW的最後,G1會分配一個空的Next位圖和一個指向分區頂部(Top)的NTAMS標記。Previous位圖記錄的上次標記數據,上次的標記位置,即PTAMS,在PTAMS與分區底部(Bottom)的範圍內,所有的存活對象都已被標記。那麼,在PTAMS與Top之間的對象都將是隱式存活(Implicitly Live)對象。在併發標記階段,Next位圖吸收了Previous位圖的標記數據,同時每個分區都會有新的對象分配,則Top與NTAMS分離,前往更高的地址空間。在併發標記的一次標記中,併發標記線程將找出NTAMS與PTAMS之間的所有存活對象,將標記數據存儲在Next位圖中。同時,在NTAMS與Top之間的對象即成爲已標記對象。如此不斷地更新Next位圖信息,並在清除階段與Previous位圖交換角色。
 

2.5.2 初始標記(Initial Mark)

初始標記(Initial Mark)負責標記所有能被直接可達的根對象(原生棧對象、全局對象、JNI對象),根是對象圖的起點,因此初始標記需要將Mutator線程(Java應用線程)暫停掉,也就是需要一個STW的時間段。事實上,當達到IHOP閾值時,G1並不會立即發起併發標記週期,而是等待下一次年輕代收集,利用年輕代收集的STW時間段,完成初始標記,這種方式稱爲借道(Piggybacking)。

2.5.3 根分區掃描(Root Region Scanning)

在初始標記暫停結束後,年輕代收集也完成的對象複製到Survivor的工作,應用線程開始活躍起來。此時爲了保證標記算法的正確性,所有新複製到Survivor分區的對象,都需要被掃描並標記成根,這個過程稱爲根分區掃描(Root Region Scanning),同時掃描的Suvivor分區也被稱爲根分區(Root Region)。根分區掃描必須在下一次年輕代垃圾收集啓動前完成(併發標記的過程中,可能會被若干次年輕代垃圾收集打斷),因爲每次GC會產生新的存活對象集合。

2.5.4 併發標記 

併發標記 Concurrent Marking和應用線程併發執行,併發標記線程在併發標記階段啓動,由參數-XX:ConcGCThreads(默認GC線程數的1/4,即-XX:ParallelGCThreads/4)控制啓動數量,每個線程每次只掃描一個分區,從而標記出存活對象圖。在這一階段會處理Previous/Next標記位圖,掃描標記對象的引用字段。同時,併發標記線程還會定期檢查和處理STAB全局緩衝區列表的記錄,更新對象引用信息。參數-XX:+ClassUnloadingWithConcurrentMark會開啓一個優化,如果一個類不可達(不是對象不可達),則在重新標記階段,這個類就會被直接卸載。所有的標記任務必須在堆滿前就完成掃描,如果併發標記耗時很長,那麼有可能在併發標記過程中,又經歷了幾次年輕代收集。如果堆滿前沒有完成標記任務,則會觸發擔保機制,經歷一次長時間的串行Full GC。

2.5.5 重新標記

重新標記(Remark)是最後一個標記階段。在該階段中,G1需要一個暫停的時間,去處理剩下的SATB日誌緩衝區和所有更新,找出所有未被訪問的存活對象,同時安全完成存活數據計算。這個階段也是並行執行的,通過參數-XX:ParallelGCThread可設置GC暫停時可用的GC線程數。同時,引用處理也是重新標記階段的一部分,所有重度使用引用對象(弱引用、軟引用、虛引用、最終引用)的應用都會在引用處理上產生開銷。

2.5.6 清除

清除 Cleanup

緊挨着重新標記階段的清除(Clean)階段也是STW的。Previous/Next標記位圖、以及PTAMS/NTAMS,都會在清除階段交換角色。清除階段主要執行以下操作:

  1. RSet梳理,啓發式算法會根據活躍度和RSet尺寸對分區定義不同等級,同時RSet數理也有助於發現無用的引用。參數-XX:+PrintAdaptiveSizePolicy可以開啓打印啓發式算法決策細節;
  2. 整理堆分區,爲混合收集週期識別回收收益高(基於釋放空間和暫停目標)的老年代分區集合;
  3. 識別所有空閒分區,即發現無存活對象的分區。該分區可在清除階段直接回收,無需等待下次收集週期。

2.6 年輕代收集、混合收集週期

年輕代收集和混合收集週期,是G1回收空間的主要活動。當應用運行開始時,堆內存可用空間還比較大,只會在年輕代滿時,觸發年輕代收集;隨着老年代內存增長,當到達IHOP閾值-XX:InitiatingHeapOccupancyPercent(老年代佔整堆比,默認45%)時,G1開始着手準備收集老年代空間。首先經歷併發標記週期,識別出高收益的老年代分區,前文已述。但隨後G1並不會馬上開始一次混合收集,而是讓應用線程先運行一段時間,等待觸發一次年輕代收集。在這次STW中,G1將保準整理混合收集週期。接着再次讓應用線程運行,當接下來的幾次年輕代收集時,將會有老年代分區加入到CSet中,即觸發混合收集,這些連續多次的混合收集稱爲混合收集週期(Mixed Collection Cycle)。

2.6.1 年輕代收集

年輕代收集 Young Collection

每次收集過程中,既有並行執行的活動,也有串行執行的活動,但都可以是多線程的。在並行執行的任務中,如果某個任務過重,會導致其他線程在等待某項任務的處理,需要對這些地方進行優化。

並行活動

  • 外部根分區掃描 Ext Root Scanning:此活動對堆外的根(JVM系統目錄、VM數據結構、JNI線程句柄、硬件寄存器、全局變量、線程對棧根)進行掃描,發現那些沒有加入到暫停收集集合CSet中的對象。如果系統目錄(單根)擁有大量加載的類,最終可能其他並行活動結束後,該活動依然沒有結束而帶來的等待時間。
  • 更新已記憶集合 Update RS:併發優化線程會對髒卡片的分區進行掃描更新日誌緩衝區來更新RSet,但只會處理全局緩衝列表。作爲補充,所有被記錄但是還沒有被優化線程處理的剩餘緩衝區,會在該階段處理,變成已處理緩衝區(Processed Buffers)。爲了限制花在更新RSet的時間,可以設置暫停佔用百分比-XX:G1RSetUpdatingPauseTimePercent(默認10%,即-XX:MaxGCPauseMills/10)。值得注意的是,如果更新日誌緩衝區更新的任務不降低,單純地減少RSet的更新時間,會導致暫停中被處理的緩衝區減少,將日誌緩衝區更新工作推到併發優化線程上,從而增加對Java應用線程資源的爭奪。
  • RSet掃描 Scan RS:在收集當前CSet之前,考慮到分區外的引用,必須掃描CSet分區的RSet。如果RSet發生粗化,則會增加RSet的掃描時間。開啓診斷模式-XX:UnlockDiagnosticVMOptions後,通過參數-XX:+G1SummarizeRSetStats可以確定併發優化線程是否能夠及時處理更新日誌緩衝區,並提供更多的信息,來幫助爲RSet粗化總數提供窗口。參數-XX:G1SummarizeRSetStatsPeriod=n可設置RSet的統計週期,即經歷多少此GC後進行一次統計
  • 代碼根掃描 Code Root Scanning:對代碼根集合進行掃描,掃描JVM編譯後代碼Native Method的引用信息(nmethod掃描),進行RSet掃描。事實上,只有CSet分區中的RSet有強代碼根時,纔會做nmethod掃描,查找對CSet的引用。
  • 轉移和回收 Object Copy:通過選定的CSet以及CSet分區完整的引用集,將執行暫停時間的主要部分:CSet分區存活對象的轉移、CSet分區空間的回收。通過工作竊取機制來負載均衡地選定複製對象的線程,並且複製和掃描對象被轉移的存活對象將拷貝到每個GC線程分配緩衝區GCLAB。G1會通過計算,預測分區複製所花費的時間,從而調整年輕代的尺寸。
  • 終止 Termination:完成上述任務後,如果任務隊列已空,則工作線程會發起終止要求。如果還有其他線程繼續工作,空閒的線程會通過工作竊取機制嘗試幫助其他線程處理。而單獨執行根分區掃描的線程,如果任務過重,最終會晚於終止。
  • GC外部的並行活動 GC Worker Other:該部分並非GC的活動,而是JVM的活動導致佔用了GC暫停時間(例如JNI編譯)。

串行活動

  • 代碼根更新 Code Root Fixup:根據轉移對象更新代碼根。
  • 代碼根清理 Code Root Purge:清理代碼根集合表。
  • 清除全局卡片標記 Clear CT:在任意收集週期會掃描CSet與RSet記錄的PRT,掃描時會在全局卡片表中進行標記,防止重複掃描。在收集週期的最後將會清除全局卡片表中的已掃描標誌。
  • 選擇下次收集集合 Choose CSet:該部分主要用於併發標記週期後的年輕代收集、以及混合收集中,在這些收集過程中,由於有老年代候選分區的加入,往往需要對下次收集的範圍做出界定;但單純的年輕代收集中,所有收集的分區都會被收集,不存在選擇。
  • 引用處理 Ref Proc:主要針對軟引用、弱引用、虛引用、final引用、JNI引用。當Ref Proc佔用時間過多時,可選擇使用參數-XX:ParallelRefProcEnabled激活多線程引用處理。G1希望應用能小心使用軟引用,因爲軟引用會一直佔據內存空間直到空間耗盡時被Full GC回收掉;即使未發生Full GC,軟引用對內存的佔用,也會導致GC次數的增加。
  • 引用排隊 Ref Enq:此項活動可能會導致RSet的更新,此時會通過記錄日誌,將關聯的卡片標記爲髒卡片。
  • 卡片重新髒化 Redirty Cards:重新髒化卡片。
  • 回收空閒巨型分區 Humongous Reclaim:G1做了一個優化:通過查看所有根對象以及年輕代分區的RSet,如果確定RSet中巨型對象沒有任何引用,則說明G1發現了一個不可達的巨型對象,該對象分區會被回收。
  • 釋放分區 Free CSet:回收CSet分區的所有空間,並加入到空閒分區中。
  • 其他活動 Other:GC中可能還會經歷其他耗時很小的活動,如修復JNI句柄等。

2.6.2 混合收集

單次的混合收集與年輕代收集並無二致。根據暫停目標,老年代的分區可能不能一次暫停收集中被處理完,G1會發起連續多次的混合收集,稱爲混合收集週期(Mixed Collection Cycle)。G1會計算每次加入到CSet中的分區數量、混合收集進行次數,並且在上次的年輕代收集、以及接下來的混合收集中,G1會確定下次加入CSet的分區集(Choose CSet),並且確定是否結束混合收集週期。

2.7 轉移失敗的擔保機制Full GC

轉移失敗(Evacuation Failure)是指當G1無法在堆空間中申請新的分區時,G1便會觸發擔保機制,執行一次STW式的、單線程的Full GC。Full GC會對整堆做標記清除和壓縮,最後將只包含純粹的存活對象。參數-XX:G1ReservePercent(默認10%)可以保留空間,來應對晉升模式下的異常情況,最大佔用整堆50%,更大也無意義。

G1在以下場景中會觸發Full GC,同時會在日誌中記錄to-space-exhausted以及Evacuation Failure:

  1. 從年輕代分區拷貝存活對象時,無法找到可用的空閒分區
  2. 從老年代分區轉移存活對象時,無法找到可用的空閒分區
  3. 分配巨型對象時在老年代無法找到足夠的連續分區

由於G1的應用場合往往堆內存都比較大,所以Full GC的收集代價非常昂貴,應該避免Full GC的發生。

 

轉自:https://blog.csdn.net/coderlius/article/details/79272773https://www.cnblogs.com/lujiango/p/9020503.html兩篇文章,內容整合的更加完整,全面。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章