【JVM系列3】方法重載和方法重寫原理分析,看完這篇終於徹底搞懂了 前言 前言 思考 棧幀 方法調用流程演示 方法調用分析 總結

前言

JVM執行字節碼指令是基於棧的架構,就是說所有的操作數都必須先入棧,然後再根據需要出棧進行操作計算,再把結果進行入棧,這個流程和基於寄存器的架構是有本質區別的,而基於寄存器架構來實現,在不同的機器上可能會無法做到完全兼容,這也是Java會選擇基於棧的設計的原因之一。

思考

我們思考下,當我們調用一個方法時,參數是怎麼傳遞的,返回值又是怎麼保存的,一個方法調用之後又是如何繼續下一個方法調用的呢?調用過程中肯定會存儲一些方法的參數和返回值等信息,這些信息存儲在哪裏呢?

JVM系列文章1中我們提到了,每次調用一個方法就會產生一個棧幀,所以我們肯定可以想到棧幀就存儲了所有調用過程中需要使用到的數據。現在就讓我們深入的去了解一下Java虛擬機棧中的棧幀吧。

棧幀

當我們調用一個方法的時候,就會產生一個棧幀,當一個方法調用完成時,它所對應的棧幀將被銷燬,無論這種完成是正常的還是突然的(拋出一個未捕獲的異常)。

每個棧幀中包括局部變量表(Local Variables)、操作數棧(Operand Stack)、動態鏈接(Dynamic Linking)、方法返回地址(Return Address)和額外的附加信息。

在給定的線程當中,永遠只有一個棧幀是活動的,所以活動的棧幀又稱之爲當前棧幀,而其對應的方法則稱之爲當前方法,定義了當前方法的類則稱之爲當前類。當一個方法調用結束時,其對應的棧幀也會被丟棄。

局部變量表(Local Variables)

局部變量表是以數組的形式存儲的,而且當前棧幀的方法所需要分配的最大長度是在編譯時就確定了。局部變量表通過index來尋址,變量從index[0]開始傳遞。

局部變量表的數組中,每一個位置可以保存一個32位的數據類型:boolean、byte、char、short、int、float、reference或returnAddress類型的值。而對於64位的數據類型long和double則需要兩個位置來存儲,但是因爲局部變量表是屬於線程私有的,所以雖然被分割爲2個變量存儲,依然不用擔心會出現安全性問題。

對於64位的數據類型,假如其佔用了數組中的index[n]和index[n+1]兩個位置,那麼不允許單獨訪問其中的某一個位置,Java虛擬機規範中規定,如果出現一個64位的數據被單獨訪問某一部分時,則在類加載機制中的校驗階段就應該拋出異常。

Java虛擬機在方法調用時使用局部變量進行傳遞參數。在類方法(static方法)調用中,所有參數都以從局部變量中的index[0]開始進行參數傳遞。而在實例方法調用上,index[0]固定用來傳遞方法所屬於的對象實例,其餘所有參數則在從局部變量表內index[1]的位置開始進行傳遞。

注意:局部變量表中的變量不可以直接使用,如需要使用的話,必須通過相關指令將其加載至操作數棧中作爲操作數才能使用

操作數棧(Operand Stacks)

操作數棧,在上下文語義清晰時,也可以稱之爲操作棧(Operand Stack),是一個後進先出(Last In First Out,LIFO)棧,同局部變量表一樣,操作數棧的最大深度也是在編譯時就確定的。

操作數棧在剛被創建時(也就是方法剛被執行的時候)是空的,然後在執行方法的過程中,通過虛擬機指令將常量/值從局部變量表或字段加載到操作數棧中,然後對其進行操作,並將操作結果壓入棧內。

操作數堆棧上的每個條目都可以保存任何Java虛擬機類型的值,包括long或double類型的值。

注意:我們必須以適合其類型的方式對操作數堆棧中的值進行操作。例如,不可能將兩個int類型的值壓入棧後將其視爲long類型,也不可能將兩個float類型值壓入棧內後使用iadd指令將其添加

動態連接(Dynamic Linking)

每個棧幀都包含一個指向運行時常量池中該棧幀所屬方法的引用,持有這個引用是爲了支持方法調用過程中的動態連接。

在Class文件中的常量池中存有大量的符號引用,字節碼中的方法調用指令就以常量池中指向方法的符號引用作爲參數,這些符號引用一部分會在類加載階段或者第一次使用的時候就轉化爲直接引用,這種就稱爲靜態解析。而另外一部分則會在每一次運行期間纔會轉化爲直接引用,這部分就稱爲動態連接。

方法返回地址

當一個方法開始執行後,只有兩種方式可以退出:一種是遇到方法返回的字節碼指令;一種是遇見異常,並且這個異常沒有在方法體內得到處理。

正常退出(Normal Method Invocation Completion)

如果對當前方法的調用正常完成,則可能會向調用方法返回一個值。當被調用的方法執行其中一個返回指令時,返回指令的選擇必須與被返回值的類型相匹配(如果有的話)。

方法正常退出時,當前棧幀通過將調用者的pc程序計數器適當的並跳過當前的調用指令來恢復調用程序的狀態,包括它的局部變量表和操作數堆棧。然後繼續在調用方法的棧幀來執行後續流程,如果有返回值的話則需要將返回值壓入操作數棧。

異常終止(Abrupt Method Invocation Completion)

如果在方法中執行Java虛擬機指令導致Java虛擬機拋出異常,並且該異常沒有在方法中處理,那麼方法調用會突然結束,因爲異常導致的方法突然結束永遠不會有返回值返回給它的調用者。

其他附加信息

這一部分具體要看虛擬機產商是如何實現的,虛擬機規範並沒有對這部分進行描述。

方法調用流程演示

上面的概念聽起來有點抽象,下面我們就通過一個簡單的例子來演示一下方法的執行流程。

package com.zwx.jvm;

public class JVMDemo {
    public static void main(String[] args) {
        int sum = add(1, 2);
        print(sum);
    }

    public static int add(int a, int b) {
        a = 3;
        int result = a + b;
        return result;
    }

    public static void print(int num) {
        System.out.println(num);
    }
}

要想了解Java虛擬機的執行流程,那麼我們必須要對類進行編譯,得到字節碼文件,執行如下命令

javap -c xxx\xxx\JVMDemo.class >1.txt

將JVMDemo.class生成的字節碼指令輸出到1.txt文件中,然後打開,看到如下字節碼指令:

Compiled from "JVMDemo.java"
public class com.zwx.jvm.JVMDemo {
  public com.zwx.jvm.JVMDemo();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]);
    Code:
       0: iconst_1
       1: iconst_2
       2: invokestatic  #2                  // Method add:(II)I
       5: istore_1
       6: iload_1
       7: invokestatic  #3                  // Method print:(I)V
      10: return

  public static int add(int, int);
    Code:
       0: iconst_3
       1: istore_0
       2: iload_0
       3: iload_1
       4: iadd
       5: istore_2
       6: iload_2
       7: ireturn

  public static void print(int);
    Code:
       0: getstatic     #4                  // Field java/lang/System.out:Ljava/io/PrintStream;
       3: iload_0
       4: invokevirtual #5                  // Method java/io/PrintStream.println:(I)V
       7: return
}

如果是第一次接觸可能指令看不太懂,但是大致的類結構還是很清晰的,我們先來對用到的字節碼指令大致說明一下:

  • iconst_i
    表示將整型數字i壓入操作數棧,注意,這裏i的返回只有-1~5,如果不在這個範圍會採用其他指令,如當int取值範圍是[-128,127]時,會採用bipush指令。
  • invokestatic
    表示調用一個靜態方法
  • istore_n
    這裏表示將一個整型數字存入局部變量表的索引n位置,因爲局部變量表是通過一個數組形式來存儲變量的
  • iload_n
    表示將局部變量位置n的變量壓入操作數棧
  • ireturn
    將當前方法的結果返回到上一個棧幀
  • invokevirtual
    調用虛方法

瞭解了字節碼指令的大概意思,接下來就讓我們來演示一下主要的幾個執行流程:

  • 1、代碼編譯之後大致得到如下的一個Java虛擬機棧,注意這時候操作數棧都是空的(pc寄存器的值在這裏暫不考慮 ,實際上調用指令的過程,pc寄存器是會一直髮生變化的)

  • 2、執行iconst_1和iconst_2兩個指令,也就是從本地變量中把整型1和2兩個數字壓入操作數棧內:

  • 3、執行invokestatic指令,調用add方法,會再次創建一個新的棧幀入棧,並且會將參數a和b存入add棧幀中的本地變量表

  • 4、add棧幀中調用iconst_3指令,從本地變量中將整型3壓入操作數棧

  • 5、add棧幀中調用istore_0,表示將當前的棧頂元素存入局部變量表index[0]的位置,也就是賦值給a。

  • 6、調用iload_0和iload_1,將局部變量表中index[0]和index[1]兩個位置的變量壓入操作數棧

  • 7、最後執行iadd指令:將3和2彈出棧後將兩個數相加,得到5,並將得到的結果5重新壓入棧內

8、執行istore_2指令,將當前棧頂元素彈出存入局部變量表index[2]的位置,並再次調用iload_2從局部變量表內將index[2]位置的數據壓入操作數棧內
![在這裏插入圖片描述](https://upload-images.jianshu.io/upload_images/17138799-4679f4a9e416d89a?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
  • 9、最後執行ireturn命令將結果5返回main棧幀,此時棧幀add被銷燬,回到main棧幀繼續後續執行

方法的調用大致就是不斷的入棧和出棧的過程,上述的過程省略了很多細節,只關注了大致流程即可,實際調用比圖中要複雜的多。

方法調用分析

我們知道,Java是一種面嚮對象語言,支持多態,而多態的體現形式就是方法重載和方法重寫,那麼Java虛擬機又是如何確認我們應該調用哪一個方法的呢?

方法調用指令

首先,我們來看一下方法的字節碼調用指令,在Java中,提供了4種字節碼指令來調用方法(jdk1.7之前):

  • 1、invokestatic:調用靜態方法
  • 2、invokespecial:調用實例構造器方法,私有方法,父類方法
  • 3、invokevirtual:調用所有的虛方法
  • 4、invokeinterface:調用接口方法(運行時會確定一個實現了接口的對象)

注意:在JDK1.7開始,Java新增了一個指令invokedynamic,這個是爲了實現“動態類型語言”而引入的,在這裏我們暫不討論

方法解析

在類加載機制中的解析階段,主要做的事情就是將符號引用轉爲直接引用,但是,對方法的調用而言,有一個前提,那就是在方法真正運行之前就可以唯一確定具體要調用哪一個方法,而且這個方法在運行期間是不可變的。只有滿足這個前提的方法纔會在解析階段直接被替換爲直接引用,否則只能等到運行時才能最終確定。

非虛方法

在Java語言中,滿足“編譯器可知,運行期不可變”這個前提的方法,被稱之爲非虛方法。非虛方法在類加載機制中的解析階段就可以直接將符號引用轉化爲直接引用。非虛方法有4種:

  • 1、靜態方法
  • 2、私有方法
  • 3、實例構造器方法
  • 4、父類方法(通過super.xxx調用,因爲Java是單繼承,只有一個父類,所以可以確定方法的唯一)

除了非虛方法之外的非final方法就被稱之爲虛方法,虛方法需要運行時才能確定真正調用哪一個方法。Java語言規範中明確指出,final方法是一種非虛方法,但是final又屬於比較特殊的存在,因爲final方法和其他非虛方法調用的字節碼指令不一樣

知道了虛方法的類型,再結合上面的方法的調用指令,我們可以知道,虛方法就是通過字節碼指令invokestatic和invokespecial調用的,而final方法又是一個例外,final方法是通過字節碼指令invokevirtual調用的,但是因爲final方法的特性就是不可被重寫,無法覆蓋,所以必然是唯一的,雖然調用指令不同,但是依然屬於非虛方法的範疇。

方法重載

先來看一個方法重載的例子:

package com.zwx.jvm.overload;

public class OverloadDemo {
    static class Human {
    }
    static class Man extends Human {
    }
    static class WoMan extends Human {
    }

    public void hello(Human human) {
        System.out.println("Hi,Human");
    }

    public void hello(Man man) {
        System.out.println("Hi,Man");
    }

    public void hello(WoMan woMan) {
        System.out.println("Hi,Women");
    }

    public static void main(String[] args) {
        OverloadDemo overloadDemo = new OverloadDemo();
        Human man = new Man();
        Human woman = new WoMan();

        overloadDemo.hello(man);
        overloadDemo.hello(woman);
    }
}

輸出結果爲:

Hi,Human
Hi,Human

這裏,Java虛擬機爲什麼會選擇參數爲Human的方法來進行調用呢?

在解釋這個問題之前,我們先來介紹一個概念:宗量

宗量

方法的接收者(調用者)和方法參數統稱爲宗量。而最終決定方法的分派就是基於宗量來選擇的,故而根據基於多少種宗量來選擇方法又可以分爲:

  • 單分派:根據1個宗量對方法進行選擇
  • 多分派:根據1個以上的宗量對方法進行選擇

知道了方法的分派是基於宗量來進行的,那我們再回到上面的例子中就很好理解了。

overloadDemo.hello(man);

這句代碼中overloadDemo表示接收者,man表示參數,而接收者是確定唯一的,就是overloadDemo實例,所以決定調用哪個方法的只有參數(包括參數類型和個數和順序)這一個宗量。我們再看看參數類型:

Human man = new Man();

這句話中,Human稱之爲變量的靜態類型,而Man則稱之爲變量的實際類型,而Java虛擬機在確認重載方法時是基於參數的靜態類型來作爲判斷依據的,故而最終實際上不管你右邊new的對象是哪個,調用的都是參數類型爲Human的方法。

靜態分派

所有依賴變量的靜態類型來定位方法執行的分派動作就稱之爲靜態分派。靜態分派最典型的應用就是方法重載。

方法重載在編譯期就能確定方法的唯一,不過雖然如此,但是在有些情況下,這個重載版本不是唯一的,甚至是有點模糊的。產生這個原因就是因爲字面量並不需要定義,所以字面量就沒有今天類型,比如我們直接調用一個方法:xxx.xxx(‘1’),這個字面量1就是模糊的,並沒有對應靜態類型。我們再來看一個例子:

package com.zwx.jvm.overload;

import java.io.Serializable;

public class OverloadDemo2 {

    public static void hello(Object a){
        System.out.println("Hello,Object");
    }
    public static void hello(double a){
        System.out.println("Hello,double");
    }
    public static void hello(Double a){
        System.out.println("Hello,Double");
    }
    public static void hello(float a){
        System.out.println("Hello,float");
    }
    public static void hello(long a){
        System.out.println("Hello,long");
    }
    public static void hello(int a){
        System.out.println("Hello,int");
    }
    public static void hello(Character a){
        System.out.println("Hello,Character");
    }
    public static void hello(char a){
        System.out.println("Hello,char");
    }
    public static void hello(char ...a){
        System.out.println("Hello,chars");
    }
    public static void hello(Serializable a){
        System.out.println("Hello,Serializable");
    }

    public static void main(String[] args) {
        OverloadDemo2.hello('1');
    }
}

這裏的輸出結果是

Hello,char

然後如果把該方法註釋掉,就會輸出:

Hello,int

再把int方法註釋掉,那麼會依次按照如下順序進行方法調用輸出:

char->int->long->float->double->Character->Serializable->Object->chars

可以看到,多參數的優先級最低,之所以會輸出Serializable是因爲包裝類Character實現了Serializable接口,注意示例中double的包裝類Double,並不會被執行。

方法重寫

我們把上面第1個例子修改一下:

package com.zwx.jvm.override;

public class OverrideDemo {
    static class Human {
        public void hello(Human human) {
            System.out.println("Hi,Human");
        }
    }

    static class Man extends Human {
        @Override
        public void hello(Human human) {
            System.out.println("Hi,Man");
        }
    }

    static class WoMan extends Human {
        @Override
        public void hello(Human human) {
            System.out.println("Hi,Women");
        }
    }

    public static void main(String[] args) {
        Human man = new Man();
        Human woman = new WoMan();

        man.hello(man);
        man.hello(woman);
        woman.hello(woman);
        woman.hello(man);
    }
}

輸出結果爲:

Hi,Man
Hi,Man
Hi,Women
Hi,Women

這裏靜態類型都是Human,但是卻輸出了兩種結果,所以肯定不是按照靜態類型來分派方法了,而從結果來看應該是按照了調用者的實際類型來進行的判斷。

執行javap命令把類轉換成字節碼:

Compiled from "OverrideDemo.java"
public class com.zwx.jvm.override.OverrideDemo {
  public com.zwx.jvm.override.OverrideDemo();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]);
    Code:
       0: new           #2                  // class com/zwx/jvm/override/OverrideDemo$Man
       3: dup
       4: invokespecial #3                  // Method com/zwx/jvm/override/OverrideDemo$Man."<init>":()V
       7: astore_1
       8: new           #4                  // class com/zwx/jvm/override/OverrideDemo$WoMan
      11: dup
      12: invokespecial #5                  // Method com/zwx/jvm/override/OverrideDemo$WoMan."<init>":()V
      15: astore_2
      16: aload_1
      17: aload_1
      18: invokevirtual #6                  // Method com/zwx/jvm/override/OverrideDemo$Human.hello:(Lcom/zwx/jvm/override/OverrideDemo$Human;)V
      21: aload_1
      22: aload_2
      23: invokevirtual #6                  // Method com/zwx/jvm/override/OverrideDemo$Human.hello:(Lcom/zwx/jvm/override/OverrideDemo$Human;)V
      26: aload_2
      27: aload_2
      28: invokevirtual #6                  // Method com/zwx/jvm/override/OverrideDemo$Human.hello:(Lcom/zwx/jvm/override/OverrideDemo$Human;)V
      31: aload_2
      32: aload_1
      33: invokevirtual #6                  // Method com/zwx/jvm/override/OverrideDemo$Human.hello:(Lcom/zwx/jvm/override/OverrideDemo$Human;)V
      36: return
}

我們可以發現這裏的方法調用使用了指令invokevirtual來調用,因爲根據上面的分類可以判斷,hello方法均是虛方法

main方法大概解釋一下,

main方法中,第7行(Code列序號)和第15行是分別把Man對象實例和Women對象實例存入局部變量變的index[1]和index[2]兩個位置,然後16,17兩行,21,22兩行,26,27兩行,31,32兩行分別是把需要用到的方法調用者和參數壓入操作數棧,然後調用invokevirtual指令調用方法

所以上面最關鍵的就是invokevirtual指令到底是如何工作的呢?invokevirtual主要是按照如下步驟進行方法選擇的:

  • 1、找到當前操作數棧中的方法接收者(調用者),記下來,比如叫Caller
  • 2、然後在類型Caller中去找方法,如果找到方法簽名一致的方法,則停止搜索,開始對方法校驗,校驗通過直接調用,校驗不通過,直接拋IllegalAccessError異常
  • 3、如果在Caller中沒有找到方法簽名一致的方法,則往上找父類,以此類推,直到找到爲止,如果到頂了還沒找到匹配的方法,則拋出AbstractMethodError異常

動態分派

上面的方法重寫例子中,在運行期間才能根據實際類型來確定方法的執行版本的分派過程就稱之爲動態分派。

單分派與多分派

上面方法重載的第1個示例中,是一個靜態分派過程,靜態分配過程中Java虛擬機選擇目標方法有兩點:

  • 1、靜態類型
  • 2、方法參數
    也就是用到了2個宗量來進行分派,所以是一個靜態多分派的過程。

而上面方法重寫的例子中,因爲方法簽名是固定的,也就是參數是固定的,那麼就只有一個宗量-靜態類型,能最終確定方法的調用,所以屬於動態單分派。

所以可以得出對Java而言:Java是一門靜態多分派,動態單分派語言

總結

本文主要介紹了一下Java虛擬機中,方法的執行流程以及方法執行過程中時,Java虛擬機棧中的內存佈局,並從字節碼的角度詮釋了Java虛擬機是如何針對方法重載和方法重寫來做出最終調用方法的選擇的。

下一篇,將會介紹Java對象在內存中的佈局,以及堆這種作爲所有線程共享的的內存區域中具體又是如何存儲對象的。

請關注我,和一起學習進步

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章