《深入理解java虚拟机》读书笔记——GC与内存分配策略

一、垃圾收集器如何判断堆里的哪些对象需要回收

1、引用计数算法:给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1;任何时刻计数器为0的对象就是不可能再被使用,作为"死对象"被垃圾收集器回收。

主流的java虚拟机没有选用引用计数算法来管理内存,主要的原因是它很难解决对象之间循环引用的问题。比如对象A和对象B都有字段obj,其中A.obj = B且B.obj = A,除此之外无其他引用,引用计数算法无法通知垃圾收集器回收它们,因为它们相互引用,彼此的引用计数都不为0,但事实上这两个对象可能再无任何引用。

2、可达性分析算法(引用链法):这个算法的基本思想就是通过一系列被称为"GC Roots"的对象作为起始点,从这些节点开始向下搜索,如果一个对象到“GC Roots”没有任何引用链(搜索所走过的路径称为引用链)相连时,则说明此对象不可用。

在java中,可作为GC Roots的对象包括下面几种:

①虚拟机栈(栈帧的局部变量表)中引用的对象。

②方法区中类静态属性引用的对象。

③方法区中常量引用的对象。

④本地方法栈中JNI(即一般说的Native方法)引用的对象。


二、垃圾收集器眼中的对象是不是只有"被引用"和"没有被引用"两种状态呢

在JDK1.2之后,java对引用的概念进行了扩充,将引用分为强引用软引用弱引用以及虚引用四种,引用强度依次逐渐减弱。

强引用:指的是类似"Object obj = new Object()"这类的引用,只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。


软引用:用来描述一些还有用但并非必须的对象。对于软引用关联着的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围进行第二次回收。若回收后还没有足够的内存,才会抛出内存溢出。JDK1.2后,提供了SoftReference类来实现软引用。(软引用一般用来做缓存)


弱引用:也是用来描述非必需对象,强度比软引用更弱,被弱引用关联的对象只能生存到下一次垃圾收集发生之前,无论当前内存是否足够。JDK1.2后,提供了WeakReference类来实现弱引用。


虚引用:也称幽灵引用或者幻影引用,它是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时受到一个系统通知。JDK1.2后,提供了PhantomReference类来实现虚引用。


三、可达性分析算法中不可达的对象的处理

如果对象在进行可达性分析后没有发现与GC Roots想连接的引用链,那他将会被第一次标记并且进行一次筛选,筛选的条件是此对象有没有必要执行finalize()方法。


没有必要执行finalize()方法的情况:若对象没有实现finalize()方法或者finalize()方法已经被虚拟机调用过。


被判定有必要执行finalize()方法之后,那么这个对象将会放在一个称为F-Queue的对队列中,虚拟机会触发一个Finalizer线程去执行,此线程是低优先级的,并且虚拟机不会承诺一直等待它运行完,这是因为如果finalize()执行缓慢或者发生了死锁,那么就会造成F-Queue队列一直等待,造成了内存回收系统的崩溃。GC对处于F-Queue中的对象进行第二次被标记,这时,该对象将被移除”即将回收”集合,等待回收。对象也可以在finalize()中重新与引用链上的任何一个对象建立关联就可以逃掉被回收的命运(比如把自己(this关键字)赋值给某个类变量或者对象的成员变量)。


四、方法区的回收

方法区进行GC性价比比较低,主要包括两部分:废弃常量无用的类

回收废弃常量与回收堆中的对象相似,以常量池中字面量的回收为例,假如一个字符串字面量"abc"已经进入了常量池,但是没有任何String对象引用这个"abc"变量,也没有其他地方引用了这个字面量,发生内存回收时,有必要的话,这个"abc"常量就会被系统清理出常量池。
判断"无用的类"的条件较苛刻,同时满足下面3个条件才算是无用的类:
1.该类的所有实例都已经被回收;
2.加载该类的ClassLoader已经被回收;
3.该类对应的java.lang.Class对象没有在任何地方被引用,无法通过反射访问该类的方法。

满足上述三个条件的类可以进行回收,并不是和对象一样必然会被回收。


五、垃圾收集算法:

1、标记-清除:
这是垃圾收集算法中最基础的,根据名字就可以知道,它的思想就是标记哪些要被回收的对象,然后统一回收。这种方法很简单,但是会有两个主要问题:1.效率不高,标记和清除的效率都很低;2.会产生大量不连续的内存碎片,导致以后程序在分配较大的对象时,由于没有充足的连续内存而提前触发一次GC动作。
2、复制算法:
为了解决效率问题,复制算法将可用内存按容量划分为相等的两部分,然后每次只使用其中的一块,当一块内存用完时,就将还存活的对象复制到第二块内存上,然后一次性清楚完第一块内存,再将第二块上的对象复制到第一块。但是这种方式,内存的代价太高,每次基本上都要浪费一般的内存。
于是将该算法进行了改进,内存区域不再是按照1:1去划分,而是将内存划分为8:1:1三部分,较大那份内存叫Eden区,其余是两块较小的内存区叫Survivor区。每次都会优先使用Eden区,若Eden区满,就将对象复制到第二块内存区上,然后清除Eden区,如果此时存活的对象太多,以至于Survivor不够时,会将这些对象通过分配担保机制复制到老年代中。(java堆又分为新生代和老年代)
3、标记-整理
该算法主要是为了解决标记-清除,产生大量内存碎片的问题;当对象存活率较高时,也解决了复制算法的效率问题。它的不同之处就是在清除对象的时候现将可回收对象移动到一端,然后清除掉端边界以外的对象,这样就不会产生内存碎片了。
4、分代收集 
现在的虚拟机垃圾收集大多采用这种方式,它根据对象的生存周期,将堆分为新生代老年代。在新生代中,由于对象生存期短,每次回收都会有大量对象死去,那么这时就采用复制算法。老年代里的对象存活率较高,没有额外的空间进行分配担保,所以可以使用标记-整理 或者 标记-清除。


六、内存分配与回收策略

1、对象优先在Eden分配

对象在新生代Eden区分配,当Eden区没有足够的空间进行分配时,虚拟机发起一次MinorGC;
2.大对象直接进入年老代
需要大量连续内存空间的Java大对象直接在年老代中分配,通过-XX:PretenureSizeThreshold参数调整门槛大小;
3.长期存活的对象将进入年老代

虚拟机给每个对象定义一个对象年龄计数器,每当该对象熬过一次Minor GC,年龄就加1,当加到一定程度(默认是15岁)时,就会晋升到年老代。通过-XX:MaxTenuringThreshold参数来设置门槛大小;

4.动态对象年龄判定

如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,那么》=该年龄的对象可以直接进入年老代,无需满足MaxTenuringThreshold要求的年龄;
5.空间分配担保
在发生Minor GC时,虚拟机会检测之前每次晋升到年老代的平均大小是否大于年老代的剩余空间大小。如果大于,则改为直接进行一次Full GC;如果小于,则查看-XX:HandlePromotionFailure设置是否允许担保失败,如果允许,只进行Minor GC,如果不允许,则还需要进行一次Full GC。一般情况为了避免Full GC过于频繁,会把HandlePromotionFailure开关打开。


七、新生代GC(Minor GC)与老年代GC(Major GC/Full GC)

当Eden区没有足够的空间进行分配时,虚拟机会执行一次Minor GC.Minor GC通常发生在新生代的Eden区,在这个区的对象生存期短,往往发生GC的频率较高,回收速度比较快。

Full GC/Major GC 发生在老年代,一般情况下,触发老年代GC的时候不会触发Minor GC,但是通过配置,可以在Full GC之前进行一次Minor GC这样可以加快老年代的回收速度。





發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章