Java編譯器對於String常量表達式的優化

http://developer.51cto.com/art/200709/56159.htm

看來Java(包括編譯器和jvm)對string的優化,真的是到了極點了,string這個所謂的“對象”,完全不可以看成一般的對象,Java對string的處理近乎於基本類型,最大限度的優化了幾乎能優化的地方。string的+號處理,算是Java語言裏面唯一的一個“運算符重載”(接觸過c++的人對這個不會陌生)吧?

AD:


首先把問題擺出來,先看這個代碼:

String a = "ab"; 
String b = "a" + "b"; 
System.out.println((a == b));

打印結果會是什麼?類似這樣的問題,有人考過我,我也拿來考過別人(蠻好玩的,大家也可以拿來問人玩),一般答案會是以下幾種:

1、true

"a" + "b" 的結果就是“ab”,這樣a,b都是“ab”了,內容一樣所以“相等”,結果true。

一般Java新人如是答。

2、false

"a" + "a"會生成新的對象“aa”,但是這個對象和String a = "ab";不同,(a == b)是比較對象引用,因此不相等,結果false。

對Java的String有一定了解的通常這樣回答。

3、true

String a = "ab";創建了新的對象“ab”;再執行String b = "a" + "b";結果b="ab",這裏沒有創建新的對象,而是從JVM字符串常量池中獲取之前已經存在的“ab”對象。因此a,b具有對同一個string對象的引用,兩個引用相等,結果true。

能回答出這個答案的,基本已經是高手了,對Java中的string機制比較瞭解。

很遺憾,這個答案是不夠準確的。或者說,根本沒有運行時計算b = "a" + "b";這個操作。實際上運行時只有String b = "ab";。

3的觀點適合解釋以下情況:

String a = "ab"; 
String b = "ab"; 
System.out.println((a == b));

如果String b = "a" + "b";是在運行期執行,則3的觀點是無法解釋的。運行期的兩個string相加,會產生新的對象的。(本文後面對此有解釋)

4、true

下面是我的回答:編譯優化+ 3的處理方式 = 最後的true

String b = "a" + "b";編譯器將這個"a" + "b"作爲常量表達式,在編譯時進行優化,直接取結果"ab",這樣這個問題退化。

String a = "ab"; String b = "ab"; System.out.println((a == b));

然後根據3的解釋,得到結果true。

這裏有一個疑問就是String不是基本類型,像

int secondsOfDay = 24 * 60 * 60;

這樣的表達式是常量表達式,編譯器在編譯時直接計算容易理解,而"a" + "b" 這樣的表達式,string是對象不是基本類型,編譯器會把它當成常量表達式來優化嗎?

下面簡單證明我的推斷,首先編譯這個類:

public class Test { 
private String a = "aa"; 
}

複製class文件備用,然後修改爲:

public class Test { private String a = "a" + "a"; }

再次編譯,用ue之類的文本編輯器打開,察看二進制內容,可以發現,兩個class文件完全一致,連一個字節都不差。

ok,真相大白了。根本不存在運行期的處理String b = "a" + "b";這樣的代碼的問題,編譯時就直接優化掉了。

下面進一步探討,什麼樣的string + 表達式會被編譯器當成常量表達式?

String b = "a" + "b";

這個String + String被正式是ok的,那麼string + 基本類型呢?

String a = "a1"; String b = "a" + 1; System.out.println((a == b)); //result = true

String a = "atrue"; String b = "a" + true; System.out.println((a == b)); //result = true

String a = "a3.4"; String b = "a" + 3.4; System.out.println((a == b)); //result = true

可見編譯器對string + 基本類型是當成常量表達式直接求值來優化的。

再注意看這裏的string都是"**"這樣的,我們換成變量來試試:

String a = "ab"; 
String bb = "b"; 
String b = "a" + bb; 
System.out.println((a == b)); //result = false

這個好理解,"a" + bb中的bb是變量,不能進行優化。這裏很很好的解釋了爲什麼3的觀點不正確,如果String+String的操作是在運行時進行的,則會產生新的對象,而不是直接從jvm的string池中獲取。

再修改一下,把bb作爲常量變量:

String a = "ab"; 
final String bb = "b"; 
String b = "a" + bb; 
System.out.println((a == b)); //result = true

竟然又是true,編譯器的優化好厲害啊!呵呵!考慮下面這種情況:

String a = "ab"; 
final String bb = getBB(); 
String b = "a" + bb; 
System.out.println((a == b)); //result = false 
private static String getBB() { 
return "b"; 
}

看來Java(包括編譯器和jvm)對string的優化,真的是到了極點了,string這個所謂的“對象”,完全不可以看成一般的對象,Java對string的處理近乎於基本類型,最大限度的優化了幾乎能優化的地方。

另外感嘆一下,string的+號處理,算是Java語言裏面唯一的一個“運算符重載”(接觸過c++的人對這個不會陌生)吧?




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章