Java 技術之類加載機制

類加載機制是 Java 語言的一大亮點,使得 Java 類可以被動態加載到 Java 虛擬機中。
這次我們拋開術語和概念,從例子入手,由淺入深地講解 Java 的類加載機制。
本文涉及知識點:雙親委託機制、BootstrapClassLoader、ExtClassLoader、AppClassLoader、自定義網絡類加載器等
文章涉及代碼:
https://github.com/wingjay/HelloJava/blob/master/common/src/classloader/HelloClassLoader.java

什麼是 Java 類加載機制?

Java 虛擬機一般使用 Java 類的流程爲:首先將開發者編寫的 Java 源代碼(.java文件)編譯成 Java 字節碼(.class文件),然後類加載器會讀取這個 .class 文件,並轉換成 java.lang.Class 的實例。有了該 Class 實例後,Java 虛擬機可以利用 newInstance 之類的方法創建其真正對象了。

ClassLoader 是 Java 提供的類加載器,絕大多數的類加載器都繼承自 ClassLoader,它們被用來加載不同來源的 Class 文件。

Class 文件有哪些來源呢?

上文提到了 ClassLoader 可以去加載多種來源的 Class,那麼具體有哪些來源呢?

首先,最常見的是開發者在應用程序中編寫的類,這些類位於項目目錄下;

然後,有 Java 內部自帶的核心類java.langjava.mathjava.io 等 package 內部的類,位於 $JAVA_HOME/jre/lib/ 目錄下,如 java.lang.String 類就是定義在 $JAVA_HOME/jre/lib/rt.jar 文件裏;

另外,還有 Java 核心擴展類,位於 $JAVA_HOME/jre/lib/ext 目錄下。開發者也可以把自己編寫的類打包成 jar 文件放入該目錄下;

最後還有一種,是動態加載遠程的 .class 文件。

既然有這麼多種類的來源,那麼在 Java 裏,是由某一個具體的 ClassLoader 來統一加載呢?還是由多個 ClassLoader 來協作加載呢?

哪些 ClassLoader 負責加載上面幾類 Class?

實際上,針對上面四種來源的類,分別有不同的加載器負責加載。

首先,我們來看級別最高的 Java 核心類,即$JAVA_HOME/jre/lib 裏的核心 jar 文件。這些類是 Java 運行的基礎類,由一個名爲 BootstrapClassLoader 加載器負責加載,它也被稱作 根加載器/引導加載器。注意,BootstrapClassLoader 比較特殊,它不繼承 ClassLoader,而是由 JVM 內部實現;

然後,需要加載 Java 核心擴展類,即 $JAVA_HOME/jre/lib/ext 目錄下的 jar 文件。這些文件由 ExtensionClassLoader 負責加載,它也被稱作 擴展類加載器。當然,用戶如果把自己開發的 jar 文件放在這個目錄,也會被 ExtClassLoader 加載;

接下來是開發者在項目中編寫的類,這些文件將由 AppClassLoader 加載器進行加載,它也被稱作 系統類加載器 System ClassLoader

最後,如果想遠程加載如(本地文件/網絡下載)的方式,則必須要自己自定義一個 ClassLoader,複寫其中的 findClass() 方法才能得以實現。

因此能看出,Java 裏提供了至少四類 ClassLoader 來分別加載不同來源的 Class。

那麼,這幾種 ClassLoader 是如何協作來加載一個類呢?

這些 ClassLoader 以何種方式來協作加載 String 類呢?

String 類是 Java 自帶的最常用的一個類,現在的問題是,JVM 將以何種方式把 String class 加載進來呢?

我們來猜想下。

首先,String 類屬於 Java 核心類,位於 $JAVA_HOME/jre/lib 目錄下。有的朋友會馬上反應過來,上文中提過了,該目錄下的類會由 BootstrapClassLoader 進行加載。沒錯,它確實是由 BootstrapClassLoader 進行加載。但,這種回答的前提是你已經知道了 String 在 $JAVA_HOME/jre/lib 目錄下。

那麼,如果你並不知道 String 類究竟位於哪呢?或者我希望你去加載一個 unknown 的類呢?

有的朋友這時會說,那很簡單,只要去遍歷一遍所有的類,看看這個 unknown 的類位於哪裏,然後再用對應的加載器去加載。

是的,思路很正確。那應該如何去遍歷呢?

比如,可以先遍歷用戶自己寫的類,如果找到了就用 AppClassLoader 去加載;否則去遍歷 Java 核心類目錄,找到了就用 BootstrapClassLoader 去加載,否則就去遍歷 Java 擴展類庫,依次類推。

這種思路方向是正確的,不過存在一個漏洞。

假如開發者自己僞造了一個 java.lang.String 類,即在項目中創建一個包java.lang,包內創建一個名爲 String 的類,這完全可以做到。那如果利用上面的遍歷方法,是不是這個項目中用到的 String 不是都變成了這個僞造的 java.lang.String 類嗎?如何解決這個問題呢?

解決方法很簡單,當查找一個類時,優先遍歷最高級別的 Java 核心類,然後再去遍歷 Java 核心擴展類,最後再遍歷用戶自定義類,而且這個遍歷過程是一旦找到就立即停止遍歷。

在 Java 中,這種實現方式也稱作 雙親委託。其實很簡單,把 BootstrapClassLoader 想象爲核心高層領導人, ExtClassLoader 想象爲中層幹部, AppClassLoader 想象爲普通公務員。每次需要加載一個類,先獲取一個系統加載器 AppClassLoader 的實例(ClassLoader.getSystemClassLoader()),然後向上級層層請求,由最上級優先去加載,如果上級覺得這些類不屬於核心類,就可以下放到各子級負責人去自行加載。

如下圖所示:


281665-6380159de55def56.png
雙親委託

真的是按照雙親委託方式進行類加載嗎?

下面通過幾個例子來驗證上面的加載方式。

開發者自定義的類會被 AppClassLoader 加載嗎?

在項目中創建一個名爲 MusicPlayer 的類文件,內容如下:

package classloader;

public class MusicPlayer {
    public void print() {
        System.out.printf("Hi I'm MusicPlayer");
    }
}

然後來加載 MusicPlayer

private static void loadClass() throws ClassNotFoundException {
    Class<?> clazz = Class.forName("classloader.MusicPlayer");
    ClassLoader classLoader = clazz.getClassLoader();
    System.out.printf("ClassLoader is %s", classLoader.getClass().getSimpleName());
}

打印結果爲:

ClassLoader is AppClassLoader

可以驗證,MusicPlayer 是由 AppClassLoader 進行的加載。

驗證 AppClassLoader 的雙親真的是 ExtClassLoader 和 BootstrapClassLoader 嗎?

這時發現 AppClassLoader 提供了一個 getParent() 的方法,來打印看看都是什麼。

private static void printParent() throws ClassNotFoundException {
        Class<?> clazz = Class.forName("classloader.MusicPlayer");
        ClassLoader classLoader = clazz.getClassLoader();
        System.out.printf("currentClassLoader is %s\n", classLoader.getClass().getSimpleName());

        while (classLoader.getParent() != null) {
            classLoader = classLoader.getParent();
            System.out.printf("Parent is %s\n", classLoader.getClass().getSimpleName());
        }
}

打印結果爲:

currentClassLoader is AppClassLoader
Parent is ExtClassLoader

首先能看到 ExtClassLoader 確實是 AppClassLoader 的雙親,不過卻沒有看到 BootstrapClassLoader。事實上,上文就提過, BootstrapClassLoader比較特殊,它是由 JVM 內部實現的,所以 ExtClassLoader.getParent() = null

如果把 MusicPlayer 類挪到 $JAVA_HOME/jre/lib/ext 目錄下會發生什麼?

上文中說了,ExtClassLoader 會加載$JAVA_HOME/jre/lib/ext 目錄下所有的 jar 文件。那來嘗試下直接把 MusicPlayer 這個類放到 $JAVA_HOME/jre/lib/ext 目錄下吧。

利用下面命令可以把 MusicPlayer.java 編譯打包成 jar 文件,並放置到對應目錄。

javac classloader/MusicPlayer.java
jar cvf MusicPlayer.jar classloader/MusicPlayer.class
mv MusicPlayer.jar $JAVA_HOME/jre/lib/ext/

這時 MusicPlayer.jar 已經被放置與 $JAVA_HOME/jre/lib/ext 目錄下,同時把之前的 MusicPlayer 刪除,而且這一次刻意使用 AppClassLoader 來加載:

private static void loadClass() throws ClassNotFoundException {
    ClassLoader appClassLoader = ClassLoader.getSystemClassLoader(); // AppClassLoader
    Class<?> clazz = appClassLoader.loadClass("classloader.MusicPlayer");
    ClassLoader classLoader = clazz.getClassLoader();
    System.out.printf("ClassLoader is %s", classLoader.getClass().getSimpleName());
}

打印結果爲:

ClassLoader is ExtClassLoader

說明即使直接用 AppClassLoader 去加載,它仍然會被 ExtClassLoader 加載到。

從源碼角度真正理解雙親委託加載機制

上面已經通過一些例子瞭解了雙親委託的一些特性了,下面來看一下它的實現代碼,加深理解。

打開 ClassLoader 裏的 loadClass() 方法,便是需要分析的源碼了。這個方法裏做了下面幾件事:

  1. 檢查目標class是否曾經加載過,如果加載過則直接返回;
  2. 如果沒加載過,把加載請求傳遞給 parent 加載器去加載;
  3. 如果 parent 加載器加載成功,則直接返回;
  4. 如果 parent 未加載到,則自身調用 findClass() 方法進行尋找,並把尋找結果返回。

代碼如下:

protected Class<?> loadClass(String name, boolean resolve)
    throws ClassNotFoundException
{
    synchronized (getClassLoadingLock(name)) {
        // 1. 檢查是否曾加載過
        Class<?> c = findLoadedClass(name);
        if (c == null) {
            long t0 = System.nanoTime();
            try {
                if (parent != null) {
                    // 優先讓 parent 加載器去加載
                    c = parent.loadClass(name, false);
                } else {
                    // 如無 parent,表示當前是 BootstrapClassLoader,調用 native 方法去 JVM 加載
                    c = findBootstrapClassOrNull(name);
                }
            } catch (ClassNotFoundException e) {
                // ClassNotFoundException thrown if class not found
                // from the non-null parent class loader
            }

            if (c == null) {
                // 如果 parent 均沒有加載到目標class,調用自身的 findClass() 方法去搜索
                long t1 = System.nanoTime();
                c = findClass(name);

                // this is the defining class loader; record the stats
                sun.misc.PerfCounter.getParentDelegationTime().addTime(t1 - t0);
                sun.misc.PerfCounter.getFindClassTime().addElapsedTimeFrom(t1);
                sun.misc.PerfCounter.getFindClasses().increment();
            }
        }
        if (resolve) {
            resolveClass(c);
        }
        return c;
    }
}

// BootstrapClassLoader 會調用 native 方法去 JVM 加載
private native Class<?> findBootstrapClass(String name);

看完實現源碼相信能夠有更完整的理解。

類加載器最酷的一面:自定義類加載器

前面提到了 Java 自帶的加載器 BootstrapClassLoaderAppClassLoaderExtClassLoader,這些都是 Java 已經提供好的。

而真正有意思的,是 自定義類加載器,它允許我們在運行時可以從本地磁盤或網絡上動態加載自定義類。這使得開發者可以動態修復某些有問題的類,熱更新代碼。

下面來實現一個網絡類加載器,這個加載器可以從網絡上動態下載 .class 文件並加載到虛擬機中使用。

後面我還會寫作與 熱修復/動態更新 相關的文章,這裏先學習 Java 層 NetworkClassLoader 相關的原理。

  1. 作爲一個 NetworkClassLoader,它首先要繼承 ClassLoader
  2. 然後它要實現ClassLoader內的 findClass() 方法。注意,不是loadClass()方法,因爲ClassLoader提供了loadClass()(如上面的源碼),它會基於雙親委託機制去搜索某個 class,直到搜索不到纔會調用自身的findClass(),如果直接複寫loadClass(),那還要實現雙親委託機制;
  3. findClass() 方法裏,要從網絡上下載一個 .class 文件,然後轉化成 Class 對象供虛擬機使用。

具體實現代碼如下:

/**
 * Load class from network
 */
public class NetworkClassLoader extends ClassLoader {

    @Override
    protected Class<?> findClass(String name) throws ClassNotFoundException {
        byte[] classData = downloadClassData(name); // 從遠程下載
        if (classData == null) {
            super.findClass(name); // 未找到,拋異常
        } else {
            return defineClass(name, classData, 0, classData.length); // convert class byte data to Class<?> object
        }
        return null;
    }

    private byte[] downloadClassData(String name) {
        // 從 localhost 下載 .class 文件
        String path = "http://localhost" + File.separatorChar + "java" + File.separatorChar + name.replace('.', File.separatorChar) + ".class"; 

        try {
            URL url = new URL(path);
            InputStream ins = url.openStream();
            ByteArrayOutputStream baos = new ByteArrayOutputStream();
            int bufferSize = 4096;
            byte[] buffer = new byte[bufferSize];
            int bytesNumRead = 0;
            while ((bytesNumRead = ins.read(buffer)) != -1) {
                baos.write(buffer, 0, bytesNumRead); // 把下載的二進制數據存入 ByteArrayOutputStream
            }
            return baos.toByteArray();
        } catch (Exception e) {
            e.printStackTrace();
        }
        return null;
    }

    public String getName() {
        System.out.printf("Real NetworkClassLoader\n");
        return "networkClassLoader";
    }
}

這個類的作用是從網絡上(這裏是本人的 local apache 服務器 http://localhost/java 上)目錄裏去下載對應的 .class 文件,並轉換成 Class<?> 返回回去使用。

下面我們來利用這個 NetworkClassLoader 去加載 localhost 上的 MusicPlayer 類:

  1. 首先把 MusicPlayer.class 放置於 /Library/WebServer/Documents/java (MacOS)目錄下,由於 MacOS 自帶 apache 服務器,這裏是服務器的默認目錄;
  2. 執行下面一段代碼:
String className = "classloader.NetworkClass";
NetworkClassLoader networkClassLoader = new NetworkClassLoader();
Class<?> clazz  = networkClassLoader.loadClass(className);
  1. 正常運行,加載 http://localhost/java/classloader/MusicPlayer.class成功。

可以看出 NetworkClassLoader 可以正常工作,如果讀者要用的話,只要稍微修改 url 的拼接方式即可自行使用。

小結

類加載方式是 Java 上非常創新的一項技術,給未來的熱修復技術提供了可能。本文力求通過簡單的語言和合適的例子來講解其中雙親委託機制自定義加載器等,並開發了自定義的NetworkClassLoader

當然,類加載是很有意思的技術,很難覆蓋所有知識點,比如不同類加載器加載同一個類,得到的實例卻不是同一個等等。

之後我還會寫作關於熱修復/動態更新相關的技術,歡迎關注。

謝謝。

wingjay

281665-9ffa921d5b9d214a.jpg
Android技術·面試技巧·職業感悟
發佈了45 篇原創文章 · 獲贊 12 · 訪問量 1萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章