淺談多態機制的意義及實現

【多態】

在面向對象編程(Object-Oriented Programming, OOP)中,多態機制無疑是其最具特色的功能,甚至可以說,不運用多態的編程不能稱之爲OOP。這也是爲什麼有人說,使用面嚮對象語言的編程和麪向對象的編程是兩碼事。

多態並沒有一個嚴格的定義,維基百科上給它下的定義比較寬鬆:

Subtype polymorphism, almost universally called just polymorphism in the context of object-oriented programming, is the ability of one type, A, to appear as and be used like another type, B.

一、子類型和子類

這裏我想先提一下子類型(Subtype)這個詞和子類(Subclass)的區別,簡單地說,只要是A類運用了extends關鍵字實現了對B類的繼承,那麼我們就可以說Class A是Class B的子類,子類是一個語法層面上的詞,只要滿足繼承的語法,就存在子類關係。

子類型比子類有更嚴格的要求,它不僅要求有繼承的語法,同時要求如果存在子類對父類方法的改寫(override),那麼改寫的內容必須符合父類原本的語義,其被調用後的作用應該和父類實現的效果方向一致。

對二者的對比是想強調一點:只有保證子類都是子類型,多態纔有意義。

二、多態的機制

本質上多態分兩種:

1、編譯時多態(又稱靜態多態)

2、運行時多態(又稱動態多態)

重載(overload)就是編譯時多態的一個例子,編譯時多態在編譯時就已經確定,運行時運行的時候調用的是確定的方法。

我們通常所說的多態指的都是運行時多態,也就是編譯時不確定究竟調用哪個具體方法,一直延遲到運行時才能確定。這也是爲什麼有時候多態方法又被稱爲延遲方法的原因。

在維基百科中多態的行爲被描述爲:

The primary usage of polymorphism in industry (object-oriented programming theory) is the ability of objects belonging to different types to respond to method, field, or property calls of the same name, each one according to an appropriate type-specific behavior.

下面簡要介紹一下運行時多態(以下簡稱多態)的機制。

多態通常有兩種實現方法:

1、子類繼承父類(extends)

2、類實現接口(implements)

無論是哪種方法,其核心之處就在於對父類方法的改寫或對接口方法的實現,以取得在運行時不同的執行效果。

要使用多態,在聲明對象時就應該遵循一條法則:聲明的總是父類類型或接口類型,創建的是實際類型。舉例來說,假設我們要創建一個ArrayList對象,聲明就應該採用這樣的語句:

List list = new ArrayList();

而不是

ArrayList list = new ArrayList();

在定義方法參數時也通常總是應該優先使用父類類型或接口類型,例如某方法應該寫成:

public void doSomething(List list);

而不是

public void doSomething(ArrayList list);

這樣聲明最大的好處在於結構的靈活性:假如某一天我認爲ArrayList的特性無法滿足我的要求,我希望能夠用LinkedList來代替它,那麼只需要在對象創建的地方把new ArrayList()改爲new LinkedList即可,其它代碼一概不用改動。

The programmer (and the program) does not have to know the exact type of the object in advance, and so the exact behavior is determined at run-time (this is called late binding or dynamic binding).

虛擬機會在執行程序時動態調用實際類的方法,它會通過一種名爲動態綁定(又稱延遲綁定)的機制自動實現,這個過程對程序員來說是透明的。

三、多態的用途

多態最大的用途我認爲在於對設計和架構的複用,更進一步來說,《設計模式》中提倡的針對接口編程而不是針對實現編程就是充分利用多態的典型例子。定義功能和組件時定義接口,實現可以留到之後的流程中。同時一個接口可以有多個實現,甚至於完全可以在一個設計中同時使用一個接口的多種實現(例如針對ArrayList和LinkedList不同的特性決定究竟採用哪種實現)。

四、多態的實現

下面從虛擬機運行時的角度來簡要介紹多態的實現原理,這裏以Java虛擬機(Java Virtual Machine, JVM)規範的實現爲例。

在JVM執行Java字節碼時,類型信息被存放在方法區中,通常爲了優化對象調用方法的速度,方法區的類型信息中增加一個指針,該指針指向一張記錄該類方法入口的表(稱爲方法表),表中的每一項都是指向相應方法的指針。

方法表的構造如下:

由於Java的單繼承機制,一個類只能繼承一個父類,而所有的類又都繼承自Object類。方法表中最先存放的是Object類的方法,接下來是該類的父類的方法,最後是該類本身的方法。這裏關鍵的地方在於,如果子類改寫了父類的方法,那麼子類和父類的那些同名方法共享一個方法表項,都被認作是父類的方法。

注意這裏只有非私有的實例方法纔會出現,並且靜態方法也不會出現在這裏,原因很容易理解:靜態方法跟對象無關,可以將方法地址直接引用,而不像實例方法需要間接引用。

更深入地講,靜態方法是由虛擬機指令invokestatic調用的,私有方法和構造函數則是由invokespecial指令調用,只有被invokevirtual和invokeinterface指令調用的方法纔會在方法表中出現。

由於以上方法的排列特性(Object——父類——子類),使得方法表的偏移量總是固定的。例如,對於任何類來說,其方法表中equals方法的偏移量總是一個定值,所有繼承某父類的子類的方法表中,其父類所定義的方法的偏移量也總是一個定值。

前面說過,方法表中的表項都是指向該類對應方法的指針,這裏就開始了多態的實現:

假設Class A是Class B的子類,並且A改寫了B的方法method(),那麼在B的方法表中,method方法的指針指向的就是B的method方法入口。

而對於A來說,它的方法表中的method方法則會指向其自身的method方法而非其父類的(這在類加載器載入該類時已經保證,同時JVM會保證總是能從對象引用指向正確的類型信息)。

結合方法指針偏移量是固定的以及指針總是指向實際類的方法域,我們不難發現多態的機制就在這裏:

在調用方法時,實際上必須首先完成實例方法的符號引用解析,結果是該符號引用被解析爲方法表的偏移量。虛擬機通過對象引用得到方法區中類型信息的入口,查詢類的方法表,當將子類對象聲明爲父類類型時,形式上調用的是父類方法,此時虛擬機會從實際類的方法表(雖然聲明的是父類,但是實際上這裏的類型信息中存放的是子類的信息)中查找該方法名對應的指針(這裏用“查找”實際上是不合適的,前面提到過,方法的偏移量是固定的,所以只需根據偏移量就能獲得指針),進而就能指向實際類的方法了。

我們的故事還沒有結束,事實上上面的過程僅僅是利用繼承實現多態的內部機制,多態的另外一種實現方式:實現接口相比而言就更加複雜,原因在於,Java的單繼承保證了類的線性關係,而接口可以同時實現多個,這樣光憑偏移量就很難準確獲得方法的指針。所以在JVM中,多態的實例方法調用實際上有兩種指令:

invokevirtual指令用於調用聲明爲類的方法;

invokeinterface指令用於調用聲明爲接口的方法。

當使用invokeinterface指令調用方法時,就不能採用固定偏移量的辦法,只能老老實實挨個找了(當然實際實現並不一定如此,JVM規範並沒有規定究竟如何實現這種查找,不同的JVM實現可以有不同的優化算法來提高搜索效率)。我們不難看出,在性能上,調用接口引用的方法通常總是比調用類的引用的方法要慢。這也告訴我們,在類和接口之間優先選擇接口作爲設計並不總是正確的,當然設計問題不在本文探討的範圍之內,但顯然具體問題具體分析仍然不失爲更好的選擇。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章