Java深度歷險(二)——Java類的加載、鏈接和初始化

原文地址

作者 成富 發佈於 2011年1月6日 

上一篇文章中介紹了Java字節代碼的操縱,其中提到了利用Java類加載器來加載修改過後的字節代碼並在JVM上執行。本文接着上一篇的話題,討論Java類的加載、鏈接和初始化。Java字節代碼的表現形式是字節數組(byte[]),而Java類在JVM中的表現形式是java.lang.Class類的對象。一個Java類從字節代碼到能夠在JVM中被使用,需要經過加載、鏈接和初始化這三個步驟。這三個步驟中,對開發人員直接可見的是Java類的加載,通過使用Java類加載器(class loader)可以在運行時刻動態的加載一個Java類;而鏈接和初始化則是在使用Java類之前會發生的動作。本文會詳細介紹Java類的加載、鏈接和初始化的過程。

Java類的加載

Java類的加載是由類加載器來完成的。一般來說,類加載器分成兩類:啓動類加載器(bootstrap)和用戶自定義的類加載器(user-defined)。兩者的區別在於啓動類加載器是由JVM的原生代碼實現的,而用戶自定義的類加載器都繼承自Java中的java.lang.ClassLoader類。在用戶自定義類加載器的部分,一般JVM都會提供一些基本實現。應用程序的開發人員也可以根據需要編寫自己的類加載器。JVM中最常使用的是系統類加載器(system),它用來啓動Java應用程序的加載。通過java.lang.ClassLoader的getSystemClassLoader()方法可以獲取到該類加載器對象。

類加載器需要完成的最終功能是定義一個Java類,即把Java字節代碼轉換成JVM中的java.lang.Class類的對象。但是類加載的過程並不是這麼簡單。Java類加載器有兩個比較重要的特徵:層次組織結構和代理模式。層次組織結構指的是每個類加載器都有一個父類加載器,通過getParent()方法可以獲取到。類加載器通過這種父親-後代的方式組織在一起,形成樹狀層次結構。代理模式則指的是一個類加載器既可以自己完成Java類的定義工作,也可以代理給其它的類加載器來完成。由於代理模式的存在,啓動一個類的加載過程的類加載器和最終定義這個類的類加載器可能並不是一個。前者稱爲初始類加載器,而後者稱爲定義類加載器。兩者的關聯在於:一個Java類的定義類加載器是該類所導入的其它Java類的初始類加載器。比如類A通過import導入了類 B,那麼由類A的定義類加載器負責啓動類B的加載過程。

一般的類加載器在嘗試自己去加載某個Java類之前,會首先代理給其父類加載器。當父類加載器找不到的時候,纔會嘗試自己加載。這個邏輯是封裝在java.lang.ClassLoader類的loadClass()方法中的。一般來說,父類優先的策略就足夠好了。在某些情況下,可能需要採取相反的策略,即先嚐試自己加載,找不到的時候再代理給父類加載器。這種做法在Java的Web容器中比較常見,也是Servlet規範推薦的做法。比如,Apache Tomcat爲每個Web應用都提供一個獨立的類加載器,使用的就是自己優先加載的策略。IBM WebSphere Application Server則允許Web應用選擇類加載器使用的策略。

類加載器的一個重要用途是在JVM中爲相同名稱的Java類創建隔離空間。在JVM中,判斷兩個類是否相同,不僅是根據該類的二進制名稱,還需要根據兩個類的定義類加載器。只有兩者完全一樣,才認爲兩個類的是相同的。因此,即便是同樣的Java字節代碼,被兩個不同的類加載器定義之後,所得到的Java類也是不同的。如果試圖在兩個類的對象之間進行賦值操作,會拋出java.lang.ClassCastException。這個特性爲同樣名稱的Java類在JVM中共存創造了條件。在實際的應用中,可能會要求同一名稱的Java類的不同版本在JVM中可以同時存在。通過類加載器就可以滿足這種需求。這種技術在OSGi中得到了廣泛的應用。

Java類的鏈接

Java類的鏈接指的是將Java類的二進制代碼合併到JVM的運行狀態之中的過程。在鏈接之前,這個類必須被成功加載。類的鏈接包括驗證、準備和解析等幾個步驟。驗證是用來確保Java類的二進制表示在結構上是完全正確的。如果驗證過程出現錯誤的話,會拋出java.lang.VerifyError錯誤。準備過程則是創建Java類中的靜態域,並將這些域的值設爲默認值。準備過程並不會執行代碼。在一個Java類中會包含對其它類或接口的形式引用,包括它的父類、所實現的接口、方法的形式參數和返回值的Java類等。解析的過程就是確保這些被引用的類能被正確的找到。解析的過程可能會導致其它的Java類被加載。

不同的JVM實現可能選擇不同的解析策略。一種做法是在鏈接的時候,就遞歸的把所有依賴的形式引用都進行解析。而另外的做法則可能是隻在一個形式引用真正需要的時候才進行解析。也就是說如果一個Java類只是被引用了,但是並沒有被真正用到,那麼這個類有可能就不會被解析。考慮下面的代碼:

public class LinkTest {   
   public static void main(String[] args) {       
      ToBeLinked toBeLinked = null;       
      System.out.println("Test link.");   
   }
}

類 LinkTest引用了類ToBeLinked,但是並沒有真正使用它,只是聲明瞭一個變量,並沒有創建該類的實例或是訪問其中的靜態域。在 Oracle的JDK 6中,如果把編譯好的ToBeLinked的Java字節代碼刪除之後,再運行LinkTest,程序不會拋出錯誤。這是因爲ToBeLinked類沒有被真正用到,而Oracle的JDK 6所採用的鏈接策略使得ToBeLinked類不會被加載,因此也不會發現ToBeLinked的Java字節代碼實際上是不存在的。如果把代碼改成ToBeLinked toBeLinked = new ToBeLinked();之後,再按照相同的方法運行,就會拋出異常了。因爲這個時候ToBeLinked這個類被真正使用到了,會需要加載這個類。

Java類的初始化

當一個Java類第一次被真正使用到的時候,JVM會進行該類的初始化操作。初始化過程的主要操作是執行靜態代碼塊和初始化靜態域。在一個類被初始化之前,它的直接父類也需要被初始化。但是,一個接口的初始化,不會引起其父接口的初始化。在初始化的時候,會按照源代碼中從上到下的順序依次執行靜態代碼塊和初始化靜態域。考慮下面的代碼:

public class StaticTest {   
   public static int X = 10;   
   public static void main(String[] args) {       
      System.out.println(Y); //輸出60   
   }   
   static {       
      X = 30;   
   }  
   public static int Y = X * 2;
}

在上面的代碼中,在初始化的時候,靜態域的初始化和靜態代碼塊的執行會從上到下依次執行。因此變量X的值首先初始化成10,後來又被賦值成30;而變量Y的值則被初始化成60。

Java類和接口的初始化只有在特定的時機纔會發生,這些時機包括:

  • 創建一個Java類的實例。如
    MyClass obj = new MyClass()
  • 調用一個Java類中的靜態方法。如
    MyClass.sayHello()
  • 給Java類或接口中聲明的靜態域賦值。如
    MyClass.value = 10
  • 訪問Java類或接口中聲明的靜態域,並且該域不是常值變量。如
    int value = MyClass.value
  • 在頂層Java類中執行assert語句。

通過Java反射API也可能造成類和接口的初始化。需要注意的是,當訪問一個Java類或接口中的靜態域的時候,只有真正聲明這個域的類或接口才會被初始化。考慮下面的代碼:

class B {   
   static int value = 100;   
   static {       
      System.out.println("Class B is initialized."); //輸出   
   }
}
class A extends B {   
   static {       
      System.out.println("Class A is initialized."); //不會輸出   
   }
}
public class InitTest {   
   public static void main(String[] args) {       
      System.out.println(A.value); //輸出100   
   }
}

在上述代碼中,類InitTest通過A.value引用了類B中聲明的靜態域value。由於value是在類B中聲明的,只有類B會被初始化,而類A則不會被初始化。

創建自己的類加載器

在 Java應用開發過程中,可能會需要創建應用自己的類加載器。典型的場景包括實現特定的Java字節代碼查找方式、對字節代碼進行加密/解密以及實現同名 Java類的隔離等。創建自己的類加載器並不是一件複雜的事情,只需要繼承自java.lang.ClassLoader類並覆寫對應的方法即可。 java.lang.ClassLoader中提供的方法有不少,下面介紹幾個創建類加載器時需要考慮的:

  • defineClass():這個方法用來完成從Java字節代碼的字節數組到java.lang.Class的轉換。這個方法是不能被覆寫的,一般是用原生代碼來實現的。
  • findLoadedClass():這個方法用來根據名稱查找已經加載過的Java類。一個類加載器不會重複加載同一名稱的類。
  • findClass():這個方法用來根據名稱查找並加載Java類。
  • loadClass():這個方法用來根據名稱加載Java類。
  • resolveClass():這個方法用來鏈接一個Java類。

這裏比較 容易混淆的是findClass()方法和loadClass()方法的作用。前面提到過,在Java類的鏈接過程中,會需要對Java類進行解析,而解析可能會導致當前Java類所引用的其它Java類被加載。在這個時候,JVM就是通過調用當前類的定義類加載器的loadClass()方法來加載其它類的。findClass()方法則是應用創建的類加載器的擴展點。應用自己的類加載器應該覆寫findClass()方法來添加自定義的類加載邏輯。 loadClass()方法的默認實現會負責調用findClass()方法。

前面提到,類加載器的代理模式默認使用的是父類優先的策略。這個策略的實現是封裝在loadClass()方法中的。如果希望修改此策略,就需要覆寫loadClass()方法。

下面的代碼給出了自定義的類加載的常見實現模式:

public class MyClassLoader extends ClassLoader {   
   protected Class<?> findClass(String name) throws ClassNotFoundException {       
      byte[] b = null; //查找或生成Java類的字節代碼       
	  return defineClass(name, b, 0, b.length);   
   }
}

參考資料


感謝張凱峯對本文的審校。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章