深入理解JVM - ZGC垃圾收集器

如果下面的一些概念有些不清楚的可以先看深入理解JVM - 垃圾收集器深入理解JVM - Shenandoah垃圾收集器

ZGC(Z Garbage Collector)是一款由Oracle公司研發的,以低延遲爲首要目標的一款垃圾收集器。它是基於動態Region內存佈局,(暫時)不設年齡分代,使用了讀屏障染色指針內存多重映射等技術來實現可併發的標記-整理算法的收集器。在JDK 11新加入,還在實驗階段,主要特點是:回收TB級內存(最大4T),停頓時間不超過10ms

動態Region

ZGC的Region可以具有如圖所示的大、中、小三類容量:

  • 小型Region(Small Region):容量固定爲2MB,用於放置小於256KB的小對象。
  • 中型Region(Medium Region):容量固定爲32MB,用於放置大於等於256KB但小於4MB的對象。·
  • 大型Region(Large Region):容量不固定,可以動態變化,但必須爲2MB的整數倍,用於放置4MB或以上的大對象。每個大型Region中只會存放一個大對象,最小容量可低至4MB,所有大型Region可能小於中型Region。大型Region在ZGC的實現中是不會被重分配的,因爲複製一個大對象的代價非常高昂。

染色指針技術

HotSpot虛擬機的標記實現方案有如下幾種:

  1. 把標記直接記錄在對象頭上(如Serial收集器);
  2. 把標記記錄在與對象相互獨立的數據結構上(如G1、Shenandoah使用了一種相當於堆內存的1/64大小的,稱爲BitMap的結構來記錄標記信息);
  3. 直接把標記信息記在引用對象的指針上(如ZGC)

染色指針是一種直接將少量額外的信息存儲在指針上的技術。目前在Linux下64位的操作系統中高18位是不能用來尋址的,但是剩餘的46爲卻可以支持64T的空間,到目前爲止我們幾乎還用不到這麼多內存。於是ZGC將46位中的高4位取出,用來存儲4個標誌位,剩餘的42位可以支持4T的內存,如圖所示:

  • Linux下64位指針的高18位不能用來尋址,所有不能使用;
  • Finalizable:表示是否只能通過finalize()方法才能被訪問到,其他途徑不行;
  • Remapped:表示是否進入了重分配集(即被移動過);
  • Marked1、Marked0:表示對象的三色標記狀態;
  • 最後42用來存對象地址,最大支持4T;

三色標記

在併發的可達性分析算法中我們使用三色標記(Tri-color Marking)來標記對象是否被收集器訪問過:

  • 白色:表示對象尚未被垃圾收集器訪問過。顯然在可達性分析剛剛開始的階段,所有的對象都是白色的,若在分析結束的階段,仍然是白色的對象,即代表不可達。
  • 黑色:表示對象已經被垃圾收集器訪問過,且這個對象的所有引用都已經掃描過。黑色的對象代表已經掃描過,它是安全存活的,如果有其他對象引用指向了黑色對象,無須重新掃描一遍。黑色對象不可能直接(不經過灰色對象)指向某個白色對象
  • 灰色:表示對象已經被垃圾收集器訪問過,但這個對象上至少存在一個引用還沒有被掃描過。

可達性分析的掃描過程,其實就是一股以灰色爲波峯的波紋從黑向白推進的過程,但是在併發的推進過程中會產生“對象消失”的問題,如圖:

對象消失理論,只有同時滿足纔會發生對象消失:

  • 賦值器插入了一條或多條從黑色對象到白色對象的新引用;
  • 賦值器刪除了全部從灰色對象到該白色對象的直接或間接引用;

要解決對象消失問題只需要破壞其中一條就行了,目前常用有兩種方案:

  • 增量更新(Incremental Update):增量更新要破壞的是第一個條件,當黑色對象插入新的指向白色對象的引用關係時,就將這個新插入的引用記錄下來,等併發掃描結束之後,再將這些記錄過的引用關係中的黑色對象爲根,重新掃描一次。這可以簡化理解爲,黑色對象一旦新插入了指向白色對象的引用之後,它就變回灰色對象了。
  • 原始快照(Snapshot At TheBeginning,SATB):原始快照要破壞的是第二個條件,當灰色對象要刪除指向白色對象的引用關係時,就將這個要刪除的引用記錄下來,在併發掃描結束之後,再將這些記錄過的引用關係中的灰色對象爲根,重新掃描一次。這也可以簡化理解爲,無論引用關係刪除與否,都會按照剛剛開始掃描那一刻的對象圖快照來進行搜索。

以上無論是對引用關係記錄的插入還是刪除,虛擬機的記錄操作都是通過寫屏障實現的。CMS是基於增量更新來做併發標記的,G1、Shenandoah則是用原始快照來實現。

染色指針的三大優勢

  1. 一旦某個Region的存活對象被移走之後,這個Region立即就能夠被釋放和重用掉,而不必等待整個堆中所有指向該Region的引用都被修正後才能清理,這使得理論上只要還有一個空閒Region,ZGC就能完成收集。而Shenandoah需要等到更新階段結束才能釋放回收集中的Region,如果Region裏面對象都存活的時候,需要1:1的空間才能完成收集。
  2. 染色指針可以大幅減少在垃圾收集過程中內存屏障的使用數量,ZGC只使用了讀屏障。
  3. 染色指針具備強大的擴展性,它可以作爲一種可擴展的存儲結構用來記錄更多與對象標記、重定位過程相關的數據,以便日後進一步提高性能。

內存多重映射

ZGC使用了內存多重映射(Multi-Mapping)將多個不同的虛擬內存地址映射到同一個物理內存地址上,這是一種多對一映射,意味着ZGC在虛擬內存中看到的地址空間要比實際的堆內存容量來得更大。把染色指針中的標誌位看作是地址的分段符,那隻要將這些不同的地址段都映射到同一個物理內存空間,經過多重映射轉換後,就可以使用染色指針正常進行尋址了,效果如圖:

ZGC的多重映射只是它採用染色指針技術的伴生產物

讀屏障

當對象從堆中加載的時候,就會使用到讀屏障(Load Barrier)。這裏使用讀屏障的主要作用就是檢查指針上的三色標記位,根據標記位判斷出對象是否被移動過,如果沒有可以直接訪問,如果移動過就需要進行“自愈”(對象訪問會變慢,但也只會有一次變慢),當“自愈”完成後,後續訪問就不會變慢了。

讀寫屏障可以理解成對象訪問的“AOP”操作

ZGC運作過程

ZGC的運作過程大致可劃分爲以下四個大的階段:

  • 併發標記(Concurrent Mark):與G1、Shenandoah一樣,併發標記是遍歷對象圖做可達性分析的階段,它的初始標記和最終標記也會出現短暫的停頓,整個標記階段只會更新染色指針中的Marked 0、Marked 1標誌位。
  • 併發預備重分配(Concurrent Prepare for Relocate):這個階段需要根據特定的查詢條件統計得出本次收集過程要清理哪些Region,將這些Region組成重分配集(Relocation Set)。ZGC每次回收都會掃描所有的Region,用範圍更大的掃描成本換取省去G1中記憶集的維護成本。
  • 併發重分配(Concurrent Relocate):重分配是ZGC執行過程中的核心階段,這個過程要把重分配集中的存活對象複製到新的Region上,併爲重分配集中的每個Region維護一個轉發表(Forward Table),記錄從舊對象到新對象的轉向關係。ZGC收集器能僅從引用上就明確得知一個對象是否處於重分配集之中,如果用戶線程此時併發訪問了位於重分配集中的對象,這次訪問將會被預置的內存屏障所截獲,然後立即根據Region上的轉發表記錄將訪問轉發到新複製的對象上,並同時修正更新該引用的值,使其直接指向新對象,ZGC將這種行爲稱爲指針的“自愈”(Self-Healing)能力。

ZGC的染色指針因爲“自愈”(Self-Healing)能力,所以只有第一次訪問舊對象會變慢,而Shenandoah的Brooks轉發指針是每次都會變慢。 一旦重分配集中某個Region的存活對象都複製完畢後,這個Region就可以立即釋放用於新對象的分配,但是轉發表還得留着不能釋放掉,因爲可能還有訪問在使用這個轉發表。

  • 併發重映射(Concurrent Remap):重映射所做的就是修正整個堆中指向重分配集中舊對象的所有引用,但是ZGC中對象引用存在“自愈”功能,所以這個重映射操作並不是很迫切。ZGC很巧妙地把併發重映射階段要做的工作,合併到了下一次垃圾收集循環中的併發標記階段裏去完成,反正它們都是要遍歷所有對象的,這樣合併就節省了一次遍歷對象圖的開銷。

ZGC存在的問題

ZGC最大的問題是浮動垃圾。

浮動垃圾

ZGC的停頓時間是在10ms以下,但是ZGC的執行時間還是遠遠大於這個時間的。假如ZGC全過程需要執行10分鐘,在這個期間由於對象分配速率很高,將創建大量的新對象,這些對象很難進入當次GC,所以只能在下次GC的時候進行回收,這些只能等到下次GC才能回收的對象就是浮動垃圾

ZGC沒有分代概念,每次都需要進行全堆掃描,導致一些“朝生夕死”的對象沒能及時的被回收。

解決方案

目前唯一的辦法是增大堆的容量,使得程序得到更多的喘息時間,但是這個也是一個治標不治本的方案。如果需要從根本上解決這個問題,還是需要引入分代收集,讓新生對象都在一個專門的區域中創建,然後專門針對這個區域進行更頻繁、更快的收集。

官方測試數據

停頓時間

在ZGC的停頓時間測試上,和其他收集器相比完全不在一個數量級,如圖:

吞吐量

ZGC的“弱項”吞吐量方面,以低延遲爲首要目標的ZGC已經達到了以高吞吐量爲目標Parallel Scavenge的99%,直接超越了G1,如圖:

優缺點

  • 優點:低停頓,高吞吐量,ZGC收集過程中額外耗費的內存小
  • 缺點:浮動垃圾
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章