之前关于反射的文章也说过java类的加载过程,但是因为主题原因没有很系统的介绍,这里系统学习介绍下。
一、类的生命周期
一个类型从被加载到虚拟机内存中开始,到卸载出内存为止,整个生命周期将会经历加载(Loading )、验证( Verification )、准备( Preparation )、解析( Resolution )、初始化(Initialization )、使用( Using )和卸载( Unloading )七个阶段,其中验证、准备、解析三个部分统称为连接(Linking )。
类的生命周期
二、类加载的过程
类加载的全过程,即加载、验证、准备、解析和初始化这五个阶段所执行的具体动作。
2.1 加载
在加载阶段, Java 虚拟机需要完成以下三件事情:
1 )通过一个类的全限定名来获取定义此类的二进制字节流。
2 )将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
3 )在内存中生成一个代表这个类的 java.lang.Class 对象,作为方法区这个类的各种数据的访问入 口。
这里的二进制字节流并非必须得从某个Class 文件中获取,具体可以从:
从 ZIP 压缩包中读取,这很常见,最终成为日后 JAR 、 EAR 、 WAR 格式的基础。
从网络中获取,这种场景最典型的应用就是 Web Applet 。
运行时计算生成,这种场景使用得最多的就是动态代理技术,在 java.lang.reflect.Proxy 中,就是用 了 ProxyGenerator.generateProxyClass() 来为特定接口生成形式为 “*$Proxy” 的代理类的二进制字节流。
由其他文件生成,典型场景是 JSP 应用,由 JSP 文件生成对应的 Class 文件。
从数据库中读取,这种场景相对少见些,例如有些中间件服务器(如 SAP Netweaver )可以选择 把程序安装到数据库中来完成程序代码在集群间的分发。
可以从加密文件中获取,这是典型的防 Class 文件被反编译的保护措施,通过加载时解密 Class 文 件来保障程序运行逻辑不被窥探。
加载阶段结束后, Java 虚拟机外部的二进制字节流就按照虚拟机所设定的格式存储在方法区之中了,方法区中的数据存储格式完全由虚拟机实现自行定义,《Java 虚拟机规范》未规定此区域的具体数据结构。类型数据妥善安置在方法区之后,会在Java 堆内存中实例化一个 java.lang.Class 类的对象,这个对象将作为程序访问方法区中的类型数据的外部接口。
加载阶段与连接阶段的部分动作(如一部分字节码文件格式验证动作)是交叉进行的,加载阶段尚未完成,连接阶段可能已经开始,但这些夹在加载阶段之中进行的动作,仍然属于连接阶段的一部分,这两个阶段的开始时间仍然保持着固定的先后顺序。
2.2 验证
验证的目的是确保 Class 文件的字节流中包含的信息符合《 Java 虚拟机规范》的全部约束要求,保证这些信息被当作代码运行后不会危害虚拟机自身的安全。
Java 语言本身是相对安全的编程语言(起码对于 C/C++ 来说是相对安全的),使用纯粹的 Java 代码无法做到诸如访问数组边界以外的数据、将一个对象转型为它并未实现的类型、跳转到不存在的代码行之类的事情,如果尝试这样去做了,编译器会毫不留情地抛出异常、拒绝编译。但前面也曾说过, Class文件并不一定只能由 Java 源码编译而来,它可以使用包括靠键盘 0 和 1 直接在二进制编辑器中敲出 Class文件在内的任何途径产生。上述 Java 代码无法做到的事情在字节码层面上都是可以实现的,至少 语义上是可以表达出来的。Java 虚拟机如果不检查输入的字节流,对其完全信任的话,很可能会因为载入了有错误或有恶意企图的字节码流而导致整个系统受攻击甚至崩溃,所以验证字节码是Java 虚拟机保护自身的一项必要措施。
验证阶段大致上会完成下面四个阶段的检验动作:文件格式验证、元数据验证、字节码验证和符号引用验证。
2.2.1 文件格式验证
要验证字节流是否符合 Class文件格式的规范,比如:
主、次版本号是否在当前 Java虚拟机接受范围之内;
常量池的常量中是否有不被支持的常量类型;
指向常量的各种索引值中是否有指向不存在的常量或不符合类型的常量;
只有通过了这个阶段的验证之后,这段字节流才被允许进入Java 虚拟机内存的方法区中进行存储,所以后面的三个验证阶段全部是基于方法区的存储结构上进行的,不会再直接读取、操作字节流了。
2.2.2 元数据验证
元数据验证是对字节码描述的信息进行语义分析,以保证其描述的信息符合《Java 语言规范》的要求,这个阶段可能包括的验证点如下:
这个类是否有父类(除了 java.lang.Object 之外,所有的类都应当有父类)。
这个类的父类是否继承了不允许被继承的类(被 final 修饰的类)。
如果这个类不是抽象类,是否实现了其父类或接口之中要求实现的所有方法。
2.2.3 字节码验证
字节码验证主要目的是通过数据流分析和控制流分析,确定程序语义是合法的、符合逻辑的。例如:
2.2.4 符号引用验证
符号引用验证发生在虚拟机将符号引用转化为直接引用 的时候,这个转化动作将在连接的第三阶段—— 解析阶段中发生。符号引用验证可以看作是对类自身以外的各类信息进行匹配性校验,通俗来说就是,该类是否缺少或者被禁止访问它依赖的某些外部类、方法、字段等资源。例如:
符号引用中通过字符串描述的全限定名是否能找到对应的类。
在指定类中是否存在符合方法的字段描述符及简单名称所描述的方法和字段。
符号引用中的类、字段、方法的可访问性( private 、 protected 、 public 、 <package> )是否可被当 前类访问。
验证阶段对于虚拟机的类加载机制来说,是一个非常重要的、但却不是必须要执行的阶段,因为验证阶段只有通过或者不通过的差别,只要通过了验证,其后就对程序运行期没有任何影响了。如果程序运行的全部代码(包括自己编写的、第三方包中的、从外部加载的、动态生成的等所有代码)都已经被反复使用和验证过,在生产环境的实施阶段就可以考虑使用-Xverify : none 参数来关闭大部分的类验证措施,以缩短虚拟机类加载的时间。
2.3 准备
准备阶段是正式为类中定义的静态变量(被 static 修饰的变量)分配内存并设置类变量初始值的阶段。
2.4 解析
解析阶段是 Java 虚拟机将常量池内的符号引用替换为直接引用的过程。
符号引用在 Class 文件中它以 CONSTANT_Class_info 、 CONSTANT_Fieldref_info、 CONSTANT_Methodref_info等类型的常量出现。 符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可。符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可。
直接引用是可以直接指向目标的指针、相对偏移量或者是一个能间接定位到目标的句柄。直接引用是和虚拟机实现的内存布局直接相关的,同一个符号引用在不同虚拟机实例上翻译出来的直接引用一般不会相同。如果有了直接引用,那引用的目标必定已经在虚拟机的内存中存在。
2.4 初始化
进行准备阶段时,变量已经赋过一次系统要求的初始零值,而在初始化阶段,则会根据程序员通过程序编码制定的主观计划去初始化类变量和其他资源。
三、类和类加载器
类与类加载器的关系是:对于任意一个类,都必须由加载它的类加载器和这个类本身一起共同确立其在Java虚拟机中的唯一性,每一个类加载器,都拥有一个独立的类名称空间。 这句话可以表达得更通俗一些:比较两个类是否“相等”,只有在这两个类是由同一个类加载器加载的前提下才有意义,否则,即使这两个类来源于同一个Class文件,被同一个Java虚拟机加载,只要加载它们的类加载器不同,那这两个类就必定不相等。
这个结论很重要!这是设计“双亲委派”模型的原因。
四、双亲委派 模型
站在 Java 虚拟机的角度来看,只存在两种不同的类加载器:一种是启动类加载器( Bootstrap ClassLoader),这个类加载器使用 C++ 语言实现 ,是虚拟机自身的一部分;另外一种就是其他所有的类加载器,这些类加载器都由Java 语言实现,独立存在于虚拟机外部,并且全都继承自抽象类java.lang.ClassLoader。
启动类加载器( Bootstrap Class Loader ):这个类加载器负责加载存放在 <JAVA_HOME>\lib 目录,或者被 -Xbootclasspath 参数所指定的路径中存放的,而且是 Java 虚拟机能够 识别的(按照文件名识别,如 rt.jar 、 tools.jar ,名字不符合的类库即使放在 lib 目录中也不会被加载)类 库加载到虚拟机的内存中。启动类加载器无法被 Java 程序直接引用,用户在编写自定义类加载器时, 如果需要把加载请求委派给引导类加载器去处理,那直接使用 null 代替即可。
扩展类加载器(Extension Class Loader):这个类加载器是在类sun.misc.Launcher$ExtClassLoader中以 Java 代码的形式实现的。它负责加载 <JAVA_HOME>\lib\ext 目录中,或者被 java.ext.dirs 系统变量所 指定的路径中所有的类库。根据 “ 扩展类加载器 ” 这个名称,就可以推断出这是一种 Java 系统类库的扩 展机制, JDK 的开发团队允许用户将具有通用性的类库放置在 ext 目录里以扩展 Java SE 的功能,在 JDK 9 之后,这种扩展机制被模块化带来的天然的扩展能力所取代。由于扩展类加载器是由 Java 代码实现 的,开发者可以直接在程序中使用扩展类加载器来加载 Class 文件。
应用程序类加载器(Application Class Loader):这个类加载器由sun.misc.Launcher$AppClassLoader 来实现。由于应用程序类加载器是 ClassLoader 类中的 getSystem- ClassLoader() 方法的返回值,所以有些场合中也称它为 “ 系统类加载器 ” 。它负责加载用户类路径 ( ClassPath )上所有的类库,开发者同样可以直接在代码中使用这个类加载器。如果应用程序中没有 自定义过自己的类加载器,一般情况下这个就是程序中默认的类加载器。
“ 双亲委派模型(Parents Delegation Model)”就是各种类加载器之间的层次关系。 双亲委派模型要求除了顶层的启动类加载器外,其余的类加载器都应有自己的父类加载器。
双亲委派模型的工作过程是: 如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传送到最顶层的启动类加载器中,只有当父加载器反馈自己无法完成这个加载请求(它的搜索范围中没有找到所需的类)时,子加载器才会尝试自己去完成加载。
双亲委派的好处就是所有类的加载最终都会汇聚到启动类加载器来加载,根据前面类和类加载器的关系介绍,
类加载器和这个类本身一起共同确立其在Java虚拟机中的唯一性,这样就使得这个类在程序的各种类加载器环境中都能够保证是同一个类。 如果没有使用双亲委派模型,都由各个类加载器自行去加载的话,如果用户自己也编写了一个名为java.lang.Object的类,并放在程序的
ClassPath 中,那系统中就会出现多个不同的 Object 类, Java 类型体系中最基础的行为也就无从保证,应用程序将会一片混乱。