一、Java泛型的實現方法:類型擦除
前面已經說了,Java的泛型是僞泛型。爲什麼說Java的泛型是僞泛型呢?因爲,在編譯期間,所有的泛型信息都會被擦除掉。正確理解泛型概念的首要前提是理解類型擦出(type erasure)。
Java中的泛型基本上都是在編譯器這個層次來實現的。在生成的Java字節碼中是不包含泛型中的類型信息的。使用泛型的時候加上的類型參數,會在編譯器在編譯的時候去掉。這個過程就稱爲類型擦除。
如在代碼中定義的List<object>和List<String>等類型,在編譯後都會編程List。JVM看到的只是List,而由泛型附加的類型信息對JVM來說是不可見的。Java編譯器會在編譯時儘可能的發現可能出錯的地方,但是仍然無法避免在運行時刻出現類型轉換異常的情況。類型擦除也是Java的泛型實現方法與C++模版機制實現方式之間的重要區別。
可以通過兩個簡單的例子,來證明java泛型的類型擦除。例1、
在這個例子中,我們定義了兩個ArrayList數組,不過一個是ArrayList<String>泛型類型,只能存儲字符串。一個是ArrayList<Integer>泛型類型,只能存儲整形。最後,我們通過arrayList1對象和arrayList2對象的getClass方法獲取它們的類的信息,最後發現結果爲true。說明泛型類型String和Integer都被擦除掉了,只剩下了原始類型。例2、
在程序中定義了一個ArrayList泛型類型實例化爲Integer的對象,如果直接調用add方法,那麼只能存儲整形的數據。不過當我們利用反射調用add方法的時候,卻可以存儲字符串。這說明了Integer泛型實例在編譯之後被擦除了,只保留了原始類型。二、類型擦除後保留的原始類型
在上面,兩次提到了原始類型,什麼是原始類型?原始類型(raw type)就是擦除去了泛型信息,最後在字節碼中的類型變量的真正類型。無論何時定義一個泛型類型,相應的原始類型都會被自動地提供。類型變量被擦除(crased),並使用其限定類型(無限定的變量用Object)替換。例3:
從上面的那個例2中,我們也可以明白ArrayList<Integer>被擦除類型後,原始類型也變成了Object,所以通過反射我們就可以存儲字符串了。
如果類型變量有限定,那麼原始類型就用第一個邊界的類型變量來替換。
比如Pair這樣聲明
例4:
那麼原始類型就是Comparable注意:
如果Pair這樣聲明public class Pair<T extends Serializable&Comparable> ,那麼原始類型就用Serializable替換,而編譯器在必要的時要向Comparable插入強制類型轉換。爲了提高效率,應該將標籤(tagging)接口(即沒有方法的接口)放在邊界限定列表的末尾。
要區分原始類型和泛型變量的類型
在調用泛型方法的時候,可以指定泛型,也可以不指定泛型。
在不指定泛型的情況下,泛型變量的類型爲 該方法中的幾種類型的同一個父類的最小級,直到Object。
在指定泛型的時候,該方法中的幾種類型必須是該泛型實例類型或者其子類。
其實在泛型類中,不指定泛型的時候,也差不多,只不過這個時候的泛型類型爲Object,就比如ArrayList中,如果不指定泛型,那麼這個ArrayList中可以放任意類型的對象。
舉例:
三、類型擦除引起的問題及解決方法
因爲種種原因,Java不能實現真正的泛型,只能使用類型擦除來實現僞泛型,這樣雖然不會有類型膨脹的問題,但是也引起了許多新的問題。所以,Sun對這些問題作出了許多限制,避免我們犯各種錯誤。
1、先檢查,在編譯,以及檢查編譯的對象和引用傳遞的問題
既然說類型變量會在編譯的時候擦除掉,那爲什麼我們往ArrayList<String> arrayList=new ArrayList<String>();所創建的數組列表arrayList中,不能使用add方法添加整形呢?不是說泛型變量Integer會在編譯時候擦除變爲原始類型Object嗎,爲什麼不能存別的類型呢?既然類型擦除了,如何保證我們只能使用泛型變量限定的類型呢?
java是如何解決這個問題的呢?java編譯器是通過先檢查代碼中泛型的類型,然後再進行類型擦除,在進行編譯的。舉個例子說明:
在上面的程序中,使用add方法添加一個整形,在eclipse中,直接就會報錯,說明這就是在編譯之前的檢查。因爲如果是在編譯之後檢查,類型擦除後,原始類型爲Object,是應該運行任意引用類型的添加的。可實際上卻不是這樣,這恰恰說明了關於泛型變量的使用,是會在編譯之前檢查的。那麼,這麼類型檢查是針對誰的呢?我們先看看參數化類型與原始類型的兼容
如果是與以前的代碼兼容,各種引用傳值之間,必然會出現如下的情況:
這樣是沒有錯誤的,不過會有個編譯時警告。
不過在第一種情況,可以實現與 完全使用泛型參數一樣的效果,第二種則完全沒效果。
因爲,本來類型檢查就是編譯時完成的。new ArrayList()只是在內存中開闢一個存儲空間,可以存儲任何的類型對象。而真正涉及類型檢查的是它的引用,因爲我們是使用它引用arrayList1 來調用它的方法,比如說調用add()方法。所以arrayList1引用能完成泛型類型的檢查。
而引用arrayList2沒有使用泛型,所以不行。
舉例子:
通過上面的例子,我們可以明白,類型檢查就是針對引用的,誰是一個引用,用這個引用調用泛型方法,就會對這個引用調用的方法進行類型檢測,而無關它真正引用的對象。
從這裏,我們可以再討論下 泛型中參數化類型爲什麼不考慮繼承關係
在Java中,像下面形式的引用傳遞是不允許的:
我們先看第一種情況,將第一種情況拓展成下面的形式:
實際上,在第4行代碼的時候,就會有編譯錯誤。那麼,我們先假設它編譯沒錯。那麼當我們使用arrayList2引用用get()方法取值的時候,返回的都是String類型的對象(上面提到了,類型檢測是根據引用來決定的。),可是它裏面實際上已經被我們存放了Object類型的對象,這樣,就會有ClassCastException了。所以爲了避免這種極易出現的錯誤,Java不允許進行這樣的引用傳遞。(這也是泛型出現的原因,就是爲了解決類型轉換的問題,我們不能違背它的初衷)。在看第二種情況,將第二種情況拓展成下面的形式:
沒錯,這樣的情況比第一種情況好的多,最起碼,在我們用arrayList2取值的時候不會出現ClassCastException,因爲是從String轉換爲Object。可是,這樣做有什麼意義呢,泛型出現的原因,就是爲了解決類型轉換的問題。我們使用了泛型,到頭來,還是要自己強轉,違背了泛型設計的初衷。所以java不允許這麼幹。再說,你如果又用arrayList2往裏面add()新的對象,那麼到時候取得時候,我怎麼知道我取出來的到底是String類型的,還是Object類型的呢?所以,要格外注意,泛型中的引用傳遞的問題。
2、自動類型轉換
因爲類型擦除的問題,所以所有的泛型類型變量最後都會被替換爲原始類型。這樣就引起了一個問題,既然都被替換爲原始類型,那麼爲什麼我們在獲取的時候,不需要進行強制類型轉換呢?看下ArrayList和get方法:
看以看到,在return之前,會根據泛型變量進行強轉。
寫了個簡單的測試代碼:
然後反編了下字節碼,如下
看第22 ,它調用的是ArrayList.get()方法,方法返回值是Object,說明類型擦除了。然後第25,它做了一個checkcast操作,即檢查類型#19, 在在上面找#19引用的類型,他是
9: new #19 // class java/util/Date
是一個Date類型,即做Date類型的強轉。
所以不是在get方法裏強轉的,是在你調用的地方強轉的。
附關於checkcast的解釋:
checkcast checks that the top item on the operand stack (a reference to an object or array) can be cast to a given type. For example, if you write in Java:
return ((String)obj);
then the Java compiler will generate something like:
aload_1 ; push -obj- onto the stack
checkcast java/lang/String ; check its a String
areturn ; return it
checkcast is actually a shortand for writing java code like:
if (! (obj == null || obj instanceof <class>)) {
throw new ClassCastException();
}
// if this point is reached, then object is either null, or an instance of
// <class> or one of its superclasses.
3、類型擦除與多態的衝突和解決方法
現在有這樣一個泛型類:
然後我們想要一個子類繼承它
在這個子類中,我們設定父類的泛型類型爲Pair<Date>,在子類中,我們覆蓋了父類的兩個方法,我們的原意是這樣的:
將父類的泛型類型限定爲Date,那麼父類裏面的兩個方法的參數都爲Date類型:“
所以,我們在子類中重寫這兩個方法一點問題也沒有,實際上,從他們的@Override標籤中也可以看到,一點問題也沒有,實際上是這樣的嗎?
分析:
實際上,類型擦除後,父類的的泛型類型全部變爲了原始類型Object,所以父類編譯之後會變成下面的樣子:
再看子類的兩個重寫的方法的類型:先來分析setValue方法,父類的類型是Object,而子類的類型是Date,參數類型不一樣,這如果實在普通的繼承關係中,根本就不會是重寫,而是重載。我們在一個main方法測試一下:
如果是重載,那麼子類中兩個setValue方法,一個是參數Object類型,一個是Date類型,可是我們發現,根本就沒有這樣的一個子類繼承自父類的Object類型參數的方法。所以說,卻是是重寫了,而不是重載了。
爲什麼會這樣呢?
原因是這樣的,我們傳入父類的泛型類型是Date,Pair<Date>,我們的本意是將泛型類變爲如下:
然後再子類中重寫參數類型爲Date的那兩個方法,實現繼承中的多態。可是由於種種原因,虛擬機並不能將泛型類型變爲Date,只能將類型擦除掉,變爲原始類型Object。這樣,我們的本意是進行重寫,實現多態。可是類型擦除後,只能變爲了重載。這樣,類型擦除就和多態有了衝突。JVM知道你的本意嗎?知道!!!可是它能直接實現嗎,不能!!!如果真的不能的話,那我們怎麼去重寫我們想要的Date類型參數的方法啊。
於是JVM採用了一個特殊的方法,來完成這項功能,那就是橋方法。
首先,我們用javap -c className的方式反編譯下DateInter子類的字節碼,結果如下:
所以,虛擬機巧妙的使用了巧方法,來解決了類型擦除和多態的衝突。
不過,要提到一點,這裏面的setValue和getValue這兩個橋方法的意義又有不同。
setValue方法是爲了解決類型擦除與多態之間的衝突。
而getValue卻有普遍的意義,怎麼說呢,如果這是一個普通的繼承關係:
那麼父類的setValue方法如下:
而子類重寫的方法是:其實這在普通的類繼承中也是普遍存在的重寫,這就是協變。關於協變:。。。。。。
並且,還有一點也許會有疑問,子類中的巧方法 Object getValue()和Date getValue()是同 時存在的,可是如果是常規的兩個方法,他們的方法簽名是一樣的,也就是說虛擬機根本不能分別這兩個方法。如果是我們自己編寫Java代碼,這樣的代碼是無法通過編譯器的檢查的,但是虛擬機卻是允許這樣做的,因爲虛擬機通過參數類型和返回類型來確定一個方法,所以編譯器爲了實現泛型的多態允許自己做這個看起來“不合法”的事情,然後交給虛擬器去區別。
4、泛型類型變量不能是基本數據類型
不能用類型參數替換基本類型。就比如,沒有ArrayList<double>,只有ArrayList<Double>。因爲當類型擦除後,ArrayList的原始類型變爲Object,但是Object類型不能存儲double值,只能引用Double的值。
5、運行時類型查詢
舉個例子:
那麼,運行時進行類型查詢的時候使用下面的方法是錯誤的
java限定了這種類型查詢的方式? 是通配符的形式 ,將在後面一篇中介紹。
6、異常中使用泛型的問題
1、不能拋出也不能捕獲泛型類的對象。事實上,泛型類擴展Throwable都不合法。例如:下面的定義將不會通過編譯:
爲什麼不能擴展Throwable,因爲異常都是在運行時捕獲和拋出的,而在編譯的時候,泛型信息全都會被擦除掉,那麼,假設上面的編譯可行,那麼,在看下面的定義:類型信息被擦除後,那麼兩個地方的catch都變爲原始類型Object,那麼也就是說,這兩個地方的catch變的一模一樣,就相當於下面的這樣這個當然就是不行的。就好比,catch兩個一模一樣的普通異常,不能通過編譯一樣:2、不能再catch子句中使用泛型變量
因爲泛型信息在編譯的時候已經變味原始類型,也就是說上面的T會變爲原始類型Throwable,那麼如果可以再catch子句中使用泛型變量,那麼,下面的定義呢:根據異常捕獲的原則,一定是子類在前面,父類在後面,那麼上面就違背了這個原則。即使你在使用該靜態方法的使用T是ArrayIndexOutofBounds,在編譯之後還是會變成Throwable,ArrayIndexOutofBounds是IndexOutofBounds的子類,違背了異常捕獲的原則。所以java爲了避免這樣的情況,禁止在catch子句中使用泛型變量。但是在異常聲明中可以使用類型變量。下面方法是合法的。
上面的這樣使用是沒問題的。7、數組(這個不屬於類型擦除引起的問題)
不能聲明參數化類型的數組。如:
數組可以記住自己的元素類型,下面的賦值會拋出一個ArrayStoreException異常。
對於泛型而言,擦除降低了這個機制的效率。下面的賦值可以通過數組存儲的檢測,但仍然會導致類型錯誤。 提示:如果需要收集參數化類型對象,直接使用ArrayList:ArrayList<Pair<String>>最安全且有效。
8、泛型類型的實例化
不能實例化泛型類型。如,
不能建立一個泛型數組。
類似的,擦除會使這個方法總是構靠一個Object[2]數組。但是,可以用反射構造泛型對象和數組。
利用反射,調用Array.newInstance:
1、
booleanequals(String); //在Pair<T>中定義
boolean equals(Object); //從object中繼承
但是,這只是一種錯覺。實際上,擦除後方法
boolean equals(T)
變成了方法 boolean equals(Object)
這與Object.equals方法是衝突的!當然,補救的辦法是重新命名引發錯誤的方法。
2、
泛型規範說明提及另一個原則“要支持擦除的轉換,需要強行制一個類或者類型變量不能同時成爲兩個接口的子類,而這兩個子類是同一接品的不同參數化。”
下面的代碼是非法的:
這一限制與類型擦除的關係並不很明確。非泛型版本:
是合法的。10、泛型在靜態方法和靜態類中的問題
泛型類中的靜態方法和靜態變量不可以使用泛型類所聲明的泛型類型參數
舉例說明:
因爲泛型類中的泛型參數的實例化是在定義對象的時候指定的,而靜態變量和靜態方法不需要使用對象來調用。對象都沒有創建,如何確定這個泛型參數是何種類型,所以當然是錯誤的。但是要注意區分下面的一種情況:
因爲這是一個泛型方法,在泛型方法中使用的T是自己在方法中定義的T,而不是泛型類中的T。