深入理解Java虚拟机(四)垃圾收集器


如果垃圾回收算法时内存回收的方法论,那么垃圾收集器就是内存回收的具体体现。

Java规范中对垃圾收集器应该如何实现并没有任何规定,因此不同的厂商、不同版本的虚拟机所提供的垃圾收集器都可能会有很大的差别,并且一般都会提供参数根据用户自己的应用特点和要求组合出各个年代所使用的收集器。下面我描述的收集器是基于JDK1.7的G1收集器之后的HotSpot虚拟机,这个JVM包含的所有收集器如下图所示:
在这里插入图片描述
上面展示了7种作用于不同分代的收集器,如果两个收集器之间存在连线,就说明它们之间可以搭配使用。所处的区域,便是它们是属于新生代收集器还是老年代收集器。

0. 基本概念

  • 并行(Parallel): 指多条垃圾收集线程并行工作,但此时用户线程仍处于等待状态。
  • 并发(Concurrent): 指用户线程与垃圾收集器同时执行(并不一定并行,可能会交替执行),用户线程继续运行,而垃圾收集程序在另外一个CPU上。
  • 吞吐量就是CPU用于运行用户代码的时间CPU总消耗时间的比值。
    吞吐量 = 运行用户代码的时间 / (运行用户代码的时间 + 垃圾收集时间)
     在这里举个例子解释一下:假设虚拟机总共运行了100分钟,其中垃圾收集花了1分钟,那吞吐量就是99%。

1. 新生代收集器

1.1 Serial收集器(串行GC)

Serial是最基本、发展历史最悠久的收集器,曾经(在JDK1.3.1之前)是虚拟机新生代收集的唯一选择。
在这里插入图片描述

  1. 特性:
  • 单线程的收集器
    它的“单线程”的意义并不仅仅说明它只会使用一个CPU或者一条收集线程去完成垃圾收集工作,更重要的是在它进行垃圾收集时,必须暂停其他所有的工作线程,直至它收集结束。
  1. 应用场景
    Serial收集器时虚拟机运行在Client模式下的默认的新生代收集器

Cilent模式:加载速度较快,为在客户端环境中减少启动时间而优化;比较适合桌面程序,它会做一些例如像快速初始化,懒加载这一类的事件来适应桌面程序的特点。《该模式JDK1.8没有了》

Server模式:
加载速度较慢但运行起来较快,为在服务器环境中最大化程序执行速度而设计;适合做服务器程序,一些针对服务器特点的事情,比如预加载,尤其在一些并发的处理上,是会做更多的优化。《它不需要可视化界面,参数已调优》

  1. 优势
      与其他收集器的单线程相比,简单而高效,对于限定单个CPU的环境来看,Serial收集器由于没有线程交互的开销,专心做垃圾收集器自然可以获得最高的单线程收集效率。实际上到现在为止:它仍然是虚拟机运行在Client模式下的默认新生代收集器。

1.2 ParNew收集器(并行GC)

ParNew收集器就是Serial收集器的多线程版本,除了使用多条线程进行垃圾收集之外,其余行为包括Serial收集器可用的所有控制字参数、收集算法、Stop the World(在它进行垃圾收集的时候,必须暂停其他所有工作线程,直至它收集结束)、对象分配规则、回收策略等都与Serial收集器完全一样。
在这里插入图片描述

  1. 特性
    Serial收集器的多线程版本。
  2. 应用场景
    ParNew收集器是许多运行在Server模式下的虚拟机中首选的新生代收集器。
     作为Server的首选收集器之中有一个与性能无关的很重要的原因是:除Serial收集器外,目前只有它能与CMS收集器配合工作。在JDK1.5时期,HotSpot推出了一款强交互应用中几乎可认为划时代意义的垃圾收集器——CMS收集器,这款收集器是HotSpot虚拟机中第一款真正意义上的并发收集器,他第一次实现了让垃圾收集线程与用户线程同时工作。不幸的是,CMS作为老年代的收集器,却无法与JDK1.4.0已经存在的新生代收集器Parallel Scavenge配合工作,所以在JDK1.5中使用CMS来收集老年代的时候,新生代只能选择ParNew或者Serial收集器中的一个。
  3. 对比分析
    与Serial收集器对比:
     ParNew收集器在单CPU的环境中绝对不会有比Serial收集器更好的效果,甚至由于存在线程交互的开销,该手机其再通过超线程技术实现的两个CPU的环境中都不能百分之百保证可以超越Serial收集器。然而随着可以使用CPU的数量增加,它对于GC系统资源的有效利用还是很有好处的。

1.3 Parallel Scavenge收集器(并行GC)

在这里插入图片描述

  1. 特性
    Parallel Scavenge收集器是一个新生代收集器,它是使用复制算法的收集器,又是并行多线程收集器。
    Parallel Scavenge收集器是一个可以控制吞吐量的收集器,通过下面两个参数实现:
XX:MaxGCPauseMills:控制最大的垃圾收集停顿时间
XX:GCRatio:直接设置吞吐量大小

  直观上,只要最大的垃圾收集停顿时间越小,吞吐量是越高的,但是GC停顿时间的缩短是以牺牲吞吐量和新生代空间作为代价的。 比如原来的10秒收集一次,每次收集停顿100毫秒,现在变成5秒收集一次,每次停顿70毫秒。停顿时间下降的同时,吞吐量也下降了。

  1. 应用场景
    停顿时间越短就越是和需要与用户交互的程序,良好的响应速度能提升用户体验,而高吞吐量则可以高效地利用CPU时间,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。
  2. 对比分析
     - Parallel Scavenge收集器 VS CMS等收集器: Parallel Scavenge收集器的特点是:它的关注点与其他收集器不同,
    CMS收集器的关注点是尽可能的缩短垃圾收集时的用户线程的停顿时间
    Parallel Scavenge收集器的目标则是可达到一个可控制的吞吐量(Throughtput)
    由于与吞吐量关系密切,Parallele Scavenge收集器也经常称为“吞吐量收集器”。
     - Parallel Scavenge收集器 VS ParNew收集器: Parallel Scavenge收集器与ParNew收集器的一个重要的区别是它具有自适应调节策略。
  3. GC自适应调节策略
    Parallel Scavenge收集器有一个参数- XX:+UseAdaptiveSizePolicy。当这个参数打开之后,就不需要手工指定新生代的大小、Eden和Survivor区的比例、晋升老年代对象年龄等细节参数了,虚拟机会根据当前系统的运行情况收集性能监控信息,动态调整这些参数以提供最合适的停顿时间或者最大的吞吐量,这种调节方法称为GC自适应调节策略(GC Ergonomics)。

2. 老年代收集器

2.1 Serial Old收集器(串行GC)

在这里插入图片描述

  1. 特性
    Serial Old是Serial收集器的老年代版本。它同样是一个单线程收集器,使用标记-整理算法
  2. 应用场景
       - Client模式 Serial Old收集器的主要意义也是在与给Client模式下的虚拟机使用。
       - Server模式 如果在Server模式下,那么它的主要还有两大用途:一种用途是在JDK1.5以及之前的版本中与Parallel Scavenge收集器搭配使用;另一种用途就是作为CMS收集器的后备预案,在并发收集发生Concurrent Mode Faliure时使用。

2.2 Parallel Old收集器(并行GC)

在这里插入图片描述

  1. 特性
    Parallel Old是Parallel Scavenge收集器的老年代版本,使用多线程和**“标记-整理”算法**。
  2. 应用场景
    注重吞吐量以及CPU资源敏感的场合,都可以优先考虑Parallel Scavenge加Parallel Old收集器。这个收集器是在JDK 1.6中才开始提供的,在此之前,新生代的Parallel Scavenge收集器一直处于比较尴尬的状态。原因是,如果新生代选择了Parallel Scavenge收集器,老年代除了Serial Old收集器外别无选择(Parallel Scavenge收集器无法与CMS收集器配合工作)。由于老年代Serial Old收集器在服务端应用性能上的“拖累”,使用了Parallel Scavenge收集器也未必能在整体应用上获得吞吐量最大化的效果,由於单线程的老年代收集中无法充分利用服务器多CPU的处理能力,在老年代很大而且硬件比较高级的环境中,这种组合的吞吐量甚至还不一定有ParNew加CMS的组合“给力”。直到Parallel Old收集器出现后,“吞吐量优先”收集器终于有了比较名副其实的应用组合。

2.3 CMS收集器(并发GC)

在这里插入图片描述

  1. 特性
    CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。目前很大一部分的Java应用集中在互联网站或者B/S系统的服务端上,这类应用尤其重视服务的响应速度,希望系统停顿时间最短,以给用户带来较好的体验。CMS收集器就非常符合这类应用的需求。
    CMS收集器是基于“标记—清除”算法实现的,它的运作过程相对于前面几种收集器来说更复杂一些,整个过程分为4个步骤:
  • 初始标记(CMS initial mark) 初始标记仅仅只是标记一下GC Roots能直接关联到的对象,速度很快,需要“Stop The World”。
  • 并发标记(CMS concurrent mark) 并发标记阶段就是进行GC Roots Tracing的过程。
  • 重新标记(CMS remark) 重新标记阶段是为了修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段稍长一些,但远比并发标记的时间短,仍然需要“Stop The World”。
  • 并发清除(CMS concurrent sweep) 并发清除阶段会清除对象。

由于整个过程中耗时最长的并发标记和并发清除过程收集器线程都可以与用户线程一起工作 所以,从总体上来说, CMS收集器的内存回收过程是与用户线程一起并发执行的。

  1. 优点: CMS是一款优秀的收集器,它的主要优点在名字上已经体现出来了:并发收集、低停顿。
  2. 缺点:
  • CMS收集器对CPU资源非常敏感。其实,面向并发设计的程序都对CPU资源比较敏感。在并发阶段,它虽然不会导致用户线程停顿,但是会因为占用了一部分线程(或者说CPU资源)而导致应用程序变慢,总吞吐量会降低CMS默认启动的回收线程数是(CPU数量+3)/ 4,也就是**当CPU在4个以上时,并发回收时垃圾收集线程不少于25%的CPU资源,并且随着CPU数量的增加而下降。**但是当CPU不足4个(譬如2个)时,CMS对用户程序的影响就可能变得很大。
  • CMS收集器无法处理浮动垃圾。CMS收集器无法处理浮动垃圾,可能出现“Concurrent Mode Failure”失败而导致另一次Full GC的产生。 由于CMS并发清理阶段用户线程还在运行着,伴随程序运行自然就还会有新的垃圾不断产生,这一部分垃圾出现在标记过程之后,CMS无法在当次收集中处理掉它们,只好留待下一次GC时再清理掉。这一部分垃圾就称为“浮动垃圾”。也是由于在垃圾收集阶段用户线程还需要运行,那也就还需要预留有足够的内存空间给用户线程使用,因此CMS收集器不能像其他收集器那样等到老年代几乎完全被填满了再进行收集,需要预留一部分空间提供并发收集时的程序运作使用。要是CMS运行期间预留的内存无法满足程序需要,就会出现一次“Concurrent Mode Failure”失败,这时虚拟机将启动后备预案:临时启用Serial Old收集器来重新进行老年代的垃圾收集,这样停顿时间就很长了。
  • CMS收集器会产生大量空间碎片。CMS是一款基于“标记—清除”算法实现的收集器,这意味着收集结束时会有大量空间碎片产生。空间碎片过多时,将会给大对象分配带来很大麻烦,往往会出现老年代还有很大空间剩余,但是无法找到足够大的连续空间来分配当前对象,不得不提前触发一次Full GC。

3. G1收集器(唯一一款全区域的垃圾回收器)

G1(Garbage First)垃圾回收器是用在heap memory很大的情况下,把heap划分为很多很多的region块,然后并行的对其进行垃圾回收。
G1垃圾回收器在清除实例所占用的内存空间后,还会做内存压缩。
G1垃圾回收器回收region的时候基本不会STW(停止用户线程),而是基于 most garbage优先回收(整体来看是基于"标记-整理"算法,从局部(两个region之间)基于"复制"算法) 的策略来对region进行垃圾回收的。
  无论如何,G1收集器采用的算法都意味着:一个region有可能属于Eden,Survivor或者Tenured内存区域。图中的

  • E表示该region属于Eden内存区域,
  • S表示属于Survivor内存区域,
  • T表示属于Tenured内存区域。
  • 图中空白的表示未使用的内存空间。
  • G1垃圾收集器还增加了一种新的内存区域,叫做Humongous内存区域,如图中的H块。这种内存区域主要用于存储大对象-即大小超过一个region大小的50%的对象。

结果如下图所示:
在这里插入图片描述
年轻代垃圾收集
  在G1垃圾收集器中,年轻代的垃圾回收过程使用复制算法。把Eden区和Survivor区的对象复制到新的Survivor区域。如下图:
在这里插入图片描述
老年代收集
  对于老年代上的垃圾收集,G1垃圾收集器也分为4个阶段,基本跟CMS垃圾收集器一样,但略有不同:

  • 初始标记(Initial Mark)阶段 :同CMS垃圾收集器的Initial Mark阶段一样,G1也需要暂停应用程序的执行,它会标记从根对象出发,在根对象的第一层孩子节点中标记所有可达的对象。但是G1的垃圾收集器的Initial Mark阶段是跟minor gc一同发生的。也就是说,在G1中,你不用像在CMS那样,单独暂停应用程序的执行来运行Initial Mark阶段,而是在G1触发minor gc的时候一并将年老代上的Initial Mark给做了。
  • 并发标记(Concurrent Mark)阶段 :在这个阶段G1做的事情跟CMS一样。但G1同时还多做了一件事情,就是如果在Concurrent Mark阶段中,发现哪些Tenured region中对象的存活率很小或者基本没有对象存活,那么G1就会在这个阶段将其回收掉,而不用等到后面的clean up阶段。这也是Garbage First名字的由来。同时,在该阶段,G1会计算每个 region的对象存活率,方便后面的clean up阶段使用 。
  • 最终标记(CMS中的Remark阶段) : 在这个阶段G1做的事情跟CMS一样, 但是采用的算法不同,G1采用一种叫做SATB(snapshot-at-the-begining)的算法能够在Remark阶段更快的标记可达对象。
  • 筛选回收(Clean up/Copy)阶段 : 在G1中,没有CMS中对应的Sweep阶段。相反 它有一个Cleanup/Copy阶段,在这个阶段中,G1会挑选出那些对象存活率低的region进行回收,这个阶段也是和minor gc一同发生的。

如下图所示:
在这里插入图片描述
G1(Garbage-First)是一款面向服务端应用的垃圾收集器。HotSpot开发团队赋予它的使命是未来可以替换掉JDK1.5中发布的CMS收集器。 如果你的应用追求低停顿,G1可以作为选择;如果你的应用追求吞吐量,G1并不带来特别明显的好处。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章