JVM系列之类加载

前言

虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这个过程就称为JVM的类加载机制。今天我们主要从下面两个方面说下类加载:类加载时机和类加载过程。

 

类加载时机

类从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期包括:加载、验证、准备、解析、初始化、使用和卸载7个阶段,其中验证+准备+解析3个阶段称为连接。

加载、验证、准备、初始化和卸载5个阶段的顺序是确定的,类加载过程必须按这5个顺序开始,解析阶段则不一定,在某些情况下可以在初始化阶段之后再开始,这是为了支持Java的运行时绑定;

 

什么时候对类进行初始化?

  • 遇到new、getstatic、putstatic或者invokestatic这4条字节码指令时,如果类没有进行初始化,则需要先触发其初始化(例如使用new关键字实例化对象,调用一个类的静态方法);

  • 使用java.lang.reflect包的方法对类进行反射调用的时候;

  • 初始化一个类的时候,如果发现其父类还没有进行初始化,则需要先触发其父类的初始化;

  • 当虚拟机启动时,用户需要指定一个要执行的主类(包含main方法的类),虚拟机会先初始化这个主类;

  • 当使用JDK1.7的动态语言支持时,如果一个java.lang.invoke.MethodHandle实例最后的解析结果REF_getStatic、REF_putStatic、REF_invokeStatic的方法句柄,并且这个方法句柄对应的类没有进行过初始化,则需要先触发其初始化;

上述五种场景行为称为对一个类进行主动引用,除此之外,所有的引用类的方式都不会触发初始化,称为被动引用。

接口的加载过程与类加载过程有一些不同,主要体现在上述第三点:当一个类在初始化时,要求其父类全部都已经初始化过,但是接口在初始化时,并不要求其父接口全部完成初始化,只有在真正使用到父类接口的时候(如引用接口中定义的常量)才会初始化。

 

类加载过程

加载:加载是类加载过程的一个阶段,在加载阶段,虚拟机要完成以下3个阶段

  • 通过一个类的全限定名来获取定义此类的二进制字节流

  • 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构

  • 在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据访问入口

对于数组类而言,情况有所不同,数组类本身不通过类加载器创建,它是由Java虚拟机直接创建。而且数组类的元素类型最终是要靠类加载器去创建,一个数组类创建过程需要遵循以下规则:

  • 如果数组的组件类型是引用类型,那就递归采用加载过程去加载这个组件类型,该数组将在加载该组件类型的类加载器的类名称空间上被标识

  • 如果数组的组件类型不是引用类型,Java虚拟机将会把数组标记为与引导类加载器关联

  • 数组类的可见性与它的组件类型的可见性一致,如果组件类型不是引用类型,那数组类的可见性将默认为public

加载阶段与连接阶段的部分内容是交叉进行的,加载阶段尚未完成,连接阶段可能已经开始,但是这两个阶段的开始时间仍然保持着固定的先后顺序。

 

验证:验证是连接的第一步,这一步阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身安全;

验证阶段大致上会完成下面4个阶段的检验动作:

  • 文件格式验证:第一阶段主要验证字节流是否符合Class文件格式的规范,并且能被当前版本的虚拟机处理,该验证阶段的主要目的是保证输入的字节流能正确的解析并存储与方法区之内,格式上符合描述一个Java类型信息的要求。该阶段的验证都是基于二进制字节流进行的,通过了该阶段验证,字节流才会进入内存的方法区中进行存储,后续阶段全部是基于方法区的存储结构进行的,不会再直接操作字节流;

    主要验证点如下:

    • 是否以魔数(起始的几个字节的内容是固定的)开头

    • 主、次版本号是否在当前虚拟机处理范围之内

    • 常量池的常量中是否有不被支持的常量类型

    • 指向常量的各种索引值是否有指向不存在的常量或不符合类型的常量

    • Class文件中各个部分及文件本身是否有被删除的或附加的其他信息

    • ... ... 

  • 元数据验证:第二阶段是对字节码描述的信息进行语义分析,以保证其描述的信息符合Java语言规范的要求,该阶段的主要目的是对类的元数据信息进行语义校验,保证不存在不符合Java语言规范的元数据信息

    主要验证点如下:

    • 该类是否有父类

    • 该类的父类是否继承了不允许被继承的类(final修饰的类)

    • 如果这个类不是抽象类,是否实现了其父类或接口之中要求实现的所有方法

    • 类中的字段、方法是否与父类产生矛盾

    • ... ... 

  • 字节码验证:该阶段的目的是通过数据流和控制流分析,确定程序语义是合法的,符合逻辑的,在上个阶段完成对元数据信息中的数据类型做完校验后,这个阶段将对类的方法体进行校验分析

  • 符号引用验证:该阶段的校验发生在虚拟机将符号引用转化为直接引用的时候,该阶段可以看作是对类自身以外的信息进行匹配性校验,符号引用的目的是确保解析动作能正常执行,该阶段主要需要校验下列内容:

    • 符号引用中通过字符串描述的全限定名是否能找到对应的类

    • 在指定类中是否存在符合方法的字段描述符以及简单名称所描述的方法和字段

    • 符号引用中的类、字段、方法的访问性是否可被当前类访问

 

准备:该阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些变量所使用的内存都将在方法区中进行分配。

 

解析:解析阶段是虚拟机将常量池内的符号引用替换为直接引用过程,那么直接引用和符号引用又有啥关联呢?

符号引用:以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用的时候能无歧义定位到目标即可,符号引用与虚拟机内存布局无关,引用的目标并不一定已经加载到内存中;

直接引用:可以是直接指向目标的指针、相对偏移量或者是一个能间接定位到目标的句柄,直接引用和虚拟机内存布局相关,同一个符号引用在不同虚拟机实例上翻译出来的直接引用一般不会相同,如果有直接引用,那么引用的目标一定已经存在于内存中;

解析的动作主要针对下面几个方面进行:

  • 类或者接口

  • 字段解析

  • 类方法解析

  • 接口方法解析

  • 方法类型

  • 方法句柄

  • 调用点限定符

 

初始化:类初始化是类加载的最后一步,这一步才是真正开始执行类中定义的Java代码或者说是字节码,此阶段根据程序员通过程序制定的主观计划去初始化类变量和其他资源,或者可以理解为:初始化阶段是执行类构造器<clinit>()方法的过程。那么我们也简单了解下<clinit>()方法的特点和细节:

  • <clinit>()方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块中的语句合并产生的

  • <clinit>()与类构造函数不同,它不需要显式的调用父类构造器,JVM保证在子类<clinit>()方法执行之前,父类的<clinit>()已经执行完毕

  • 因为父类的<clinit>()先执行,也就是说父类中定义的静态语句块要优先于子类的变量赋值操作

  • <clinit>()对于类和接口来说不是必需的,如果一个类没有静态语句也没有对变量的赋值操作,那么就不会对该类生成<clinit>()

  • 接口中不能使用静态语句块,但仍然有变量初始化的赋值操作,因此接口也会生成<clinit>(),但是与类不同的是,接口的<clinit>()方法不需要先执行父类的<clinit>(),只有当父类中定义的变量被使用时,父接口才会初始化

  • JVM保证一个类的<clinit>()在多线程下能被正确的加锁、同步、如果多线程同时去初始化一个类,那么只会又一个线程去执行这个类的<clinit>()方法,其他线程阻塞等待,直到<clinit>()执行完毕

使用和卸载就不用多说了

 

以上就是我们今天所说的类加载时机和类加载过程,希望读者对类加载有个初步的认识

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章