什麼是逃逸分析?
逃逸分析的基本行爲就是分析對象動態作用域:當一個對象在方法中被定義後,它可能被外部方法所引用,例如作爲調用參數傳遞到其他地方中,稱爲方法逃逸。
例如以下代碼:
public static StringBuffer craeteStringBuffer(String s1, String s2) {
StringBuffer sb = new StringBuffer();
sb.append(s1);
sb.append(s2);
return sb;
}
public static String createStringBuffer(String s1, String s2) {
StringBuffer sb = new StringBuffer();
sb.append(s1);
sb.append(s2);
return sb.toString();
}
第一段代碼中的sb就逃逸了(sb對象作參數返回,傳遞到其他作用域),而第二段代碼中的sb就沒有逃逸(返回的是sb.toString(),sb對象作用域沒有發生改變)。
瞭解了 Java 中的逃逸分析技術,再來了解下一個對象的逃逸狀態。
1、全局逃逸(GlobalEscape)
即一個對象的作用範圍逃出了當前方法或者當前線程,有以下幾種場景:
-
對象是一個靜態變量
-
對象是一個已經發生逃逸的對象
-
對象作爲當前方法的返回值
2、參數逃逸(ArgEscape)
即一個對象被作爲方法參數傳遞或者被參數引用,但在調用過程中不會發生全局逃逸,這個狀態是通過被調方法的字節碼確定的。
3、沒有逃逸
即方法中的對象沒有發生逃逸。
使用逃逸分析,編譯器可以對代碼做如下優化:
- 同步省略。如果一個對象被發現只能從一個線程被訪問到,那麼對於這個對象的操作可以不考慮同步。
- 將堆分配轉化爲棧分配。如果一個對象在子程序中被分配,要使指向該對象的指針永遠不會逃逸,對象可能是棧分配的候選,而不是堆分配。
- 分離對象或標量替換。有的對象可能不需要作爲一個連續的內存結構存在也可以被訪問到,那麼對象的部分(或全部)可以不存儲在內存,而是存儲在CPU寄存器中。
在Java代碼運行時,通過JVM參數可指定是否開啓逃逸分析,
-
開啓逃逸分析:-XX:+DoEscapeAnalysis
-
關閉逃逸分析:-XX:-DoEscapeAnalysis
-
顯示分析結果:-XX:+PrintEscapeAnalysis
從jdk 1.7開始已經默認開始逃逸分析,如需關閉,需要指定-XX:-DoEscapeAnalysis
同步省略
在動態編譯同步塊的時候,JIT編譯器可以藉助逃逸分析來判斷同步塊所使用的鎖對象是否只能夠被一個線程訪問而沒有被髮布到其他線程。如果同步塊所使用的鎖對象通過這種分析被證實只能夠被一個線程訪問,那麼JIT編譯器在編譯這個同步塊的時候就會取消對這部分代碼的同步。這個取消同步的過程就叫同步省略,也叫鎖消除。
如下代碼:
public void f() {
Object obj = new Object();
synchronized(obj) {
System.out.println(obj);
}
}
代碼中對obj這個對象進行加鎖,但是obj對象的生命週期只在f()方法中,並不會被其他線程所訪問到,所以在JIT編譯階段就會被優化掉。優化成:
public void f() {
Object obj = new Object();
System.out.println(hollis);
}
所以,在使用synchronized的時候,如果JIT經過逃逸分析之後發現並無線程安全問題的話,就會做鎖消除。
鎖消除的 JVM 參數如下:
-
開啓鎖消除:-XX:+EliminateLocks
-
關閉鎖消除:-XX:-EliminateLocks
標量替換
標量(Scalar)是指一個無法再分解成更小的數據的數據。Java中的原始數據類型就是標量。相對的,那些還可以分解的數據叫做聚合量(Aggregate),Java中的對象就是聚合量,因爲他可以分解成其他聚合量和標量。在JIT階段,如果經過逃逸分析,發現一個對象不會被外界訪問的話,那麼經過JIT優化,就會把這個對象拆解成若干個其中包含的若干個成員變量來代替。這個過程就是標量替換。
public static void main(String[] args) {
alloc();
}
private static void alloc() {
Point point = new Point(1,2);
System.out.println("point.x="+point.x+"; point.y="+point.y);
}
class Point{
private int x;
private int y;
}
以上代碼中,point對象並沒有逃逸出alloc方法,並且point對象是可以拆解成標量的。那麼,JIT就會不會直接創建Point對象,而是直接使用兩個標量int x ,int y來替代Point對象。以上代碼,經過標量替換後,就會變成:
private static void alloc() {
int x = 1;
int y = 2;
System.out.println("point.x="+x+"; point.y="+y);
}
可以看到,Point這個聚合量經過逃逸分析後,發現他並沒有逃逸,就被替換成兩個聚合量了。那麼標量替換有什麼好處呢?就是可以大大減少堆內存的佔用。因爲一旦不需要創建對象了,那麼就不再需要分配堆內存了。標量替換爲棧上分配提供了很好的基礎。
標量替換的 JVM 參數如下:
-
開啓標量替換:-XX:+EliminateAllocations
-
關閉標量替換:-XX:-EliminateAllocations
-
顯示標量替換詳情:-XX:+PrintEliminateAllocations
棧上分配
在Java虛擬機中,對象是在Java堆中分配內存的,這是一個普遍的常識。但是,有一種特殊情況,那就是如果經過逃逸分析後發現,一個對象並沒有逃逸出方法的話,那麼就可能被優化成棧上分配。這樣就無需在堆上分配內存,也無須進行垃圾回收了(對象生命期跟隨着線程的生命期,線程結束後對象自動回收)
關於逃逸分析
關於逃逸分析的論文在1999年就已經發表了,但直到JDK 1.6纔有實現,而且這項技術到如今也並不是十分成熟的。其根本原因就是無法保證逃逸分析的性能消耗一定能高於他的消耗。雖然經過逃逸分析可以做標量替換、棧上分配、和鎖消除。但是逃逸分析自身也是需要進行一系列複雜的分析的,這其實也是一個相對耗時的過程。一個極端的例子,就是經過逃逸分析之後,發現沒有一個對象是不逃逸的。那這個逃逸分析的過程就白白浪費掉了。雖然這項技術並不十分成熟,但是他也是即時編譯器優化技術中一個十分重要的手段。