面試必問:對象不再使用時,爲什麼要賦值爲 null ?

點擊上方 "JAVA開發大本營"關注, 置頂或星標一起學習

每天晚上10點00分 , 我們不見不散


導讀
許多Java開發者都曾聽說過“不使用的對象應手動賦值爲null“這句話,而且好多開發者一直信奉着這句話;問其原因,大都是回答“有利於GC更早回收內存,減少內存佔用”,但再往深入問就回答不出來了。

每日雞湯
堅持就是勝利,學無止境。




責任編輯:濤哥
鏈接:https://www.polarxiong.com/

Spring Boot 服務監控,健康檢查,線程信息,JVM堆信息,指標收集,運行情況監控等!

springboot與redis攜手完成接口冪等性校驗


正文

前言

許多Java開發者都曾聽說過“不使用的對象應手動賦值爲null“這句話,而且好多開發者一直信奉着這句話;問其原因,大都是回答“有利於GC更早回收內存,減少內存佔用”,但再往深入問就回答不出來了。


鑑於網上有太多關於此問題的誤導,本文將通過實例,深入JVM剖析“對象不再使用時賦值爲null”這一操作存在的意義,供君參考。本文儘量不使用專業術語,但仍需要你對JVM有一些概念。


示例代碼

我們來看看一段非常簡單的代碼:

public static void main(String[] args{  
    if (true) {  
        byte[] placeHolder = new byte[64 * 1024 * 1024];  
        System.out.println(placeHolder.length / 1024);  
    }  
    System.gc();  
}

我們在if中實例化了一個數組placeHolder,然後在if的作用域外通過System.gc();手動觸發了GC,其用意是回收placeHolder,因爲placeHolder已經無法訪問到了。來看看輸出:

65536  
[GC 68239K->65952K(125952K), 0.0014820 secs]  
[Full GC 65952K->65881K(125952K), 0.0093860 secs]

Full GC 65952K->65881K(125952K)代表的意思是:本次GC後,內存佔用從65952K降到了65881K。意思其實是說GC沒有將placeHolder回收掉,是不是不可思議?


下面來看看遵循“不使用的對象應手動賦值爲null“的情況:

public static void main(String[] args{  
    if (true) {  
        byte[] placeHolder = new byte[64 * 1024 * 1024];  
        System.out.println(placeHolder.length / 1024);  
        placeHolder = null;  
    }  
    System.gc();  
}

其輸出爲:

65536  
[GC 68239K->65952K(125952K), 0.0014910 secs]  
[Full GC 65952K->345K(125952K), 0.0099610 secs]

這次GC後內存佔用下降到了345K,即placeHolder被成功回收了!對比兩段代碼,僅僅將placeHolder賦值爲null就解決了GC的問題,真應該感謝“不使用的對象應手動賦值爲null“。


等等,爲什麼例子裏placeHolder不賦值爲null,GC就“發現不了”placeHolder該回收呢?這纔是問題的關鍵所在。


運行時棧

典型的運行時棧

如果你瞭解過編譯原理,或者程序執行的底層機制,你會知道方法在執行的時候,方法裏的變量(局部變量)都是分配在棧上的;當然,對於Java來說,new出來的對象是在堆中,但棧中也會有這個對象的指針,和int一樣。

比如對於下面這段代碼:

public static void main(String[] args) {  
    int a = 1;  
    int b = 2;  
    int c = a + b;  
}

其運行時棧的狀態可以理解成:

索引
變量
1
a
2
b
3
c


“索引”表示變量在棧中的序號,根據方法內代碼執行的先後順序,變量被按順序放在棧中。

再比如:

public static void main(String[] args) {  
    if (true) {  
        int a = 1;  
        int b = 2;  
        int c = a + b;  
    }  
    int d = 4;  
}

這時運行時棧就是:

索引 變量
1 a
2
b
3
c
4
d


容易理解吧?其實仔細想想上面這個例子的運行時棧是有優化空間的。


Java的棧優化

上面的例子,main()方法運行時佔用了4個棧索引空間,但實際上不需要佔用這麼多。當if執行完後,變量a、b和c都不可能再訪問到了,所以它們佔用的1~3的棧索引是可以“回收”掉的,比如像這樣:

索引 變量
1
a
2
b
3
c
1
d


變量d重用了變量a的棧索引,這樣就節約了內存空間。


提醒

上面的“運行時棧”和“索引”是爲方便引入而故意發明的詞,實際上在JVM中,它們的名字分別叫做“局部變量表”和“Slot”。而且局部變量表在編譯時即已確定,不需要等到“運行時”。


GC一瞥

這裏來簡單講講主流GC裏非常簡單的一小塊:如何確定對象可以被回收。另一種表達是,如何確定對象是存活的。

仔細想想,Java的世界中,對象與對象之間是存在關聯的,我們可以從一個對象訪問到另一個對象。如圖所示。

再仔細想想,這些對象與對象之間構成的引用關係,就像是一張大大的圖;更清楚一點,是衆多的樹。


如果我們找到了所有的樹根,那麼從樹根走下去就能找到所有存活的對象,那麼那些沒有找到的對象,就是已經死亡的了!這樣GC就可以把那些對象回收掉了。

現在的問題是,怎麼找到樹根呢?JVM早有規定,其中一個就是:棧中引用的對象。也就是說,只要堆中的這個對象,在棧中還存在引用,就會被認定是存活的

提醒

上面介紹的確定對象可以被回收的算法,其名字是“可達性分析算法”。

JVM的“bug”

我們再來回頭看看最開始的例子:

public static void main(String[] args{  
    if (true) {  
        byte[] placeHolder = new byte[64 * 1024 * 1024];  
        System.out.println(placeHolder.length / 1024);  
    }  
    System.gc();  
}

看看其運行時棧:

LocalVariableTable:  
Start  Length  Slot  Name   Signature  
    0      21     0  args   [Ljava/lang/String;  
    5      12     1 placeHolder   [B

棧中第一個索引是方法傳入參數args,其類型爲String[];第二個索引是placeHolder,其類型爲byte[]。


聯繫前面的內容,我們推斷placeHolder沒有被回收的原因:System.gc();觸發GC時,main()方法的運行時棧中,還存在有對args和placeHolder的引用,GC判斷這兩個對象都是存活的,不進行回收。也就是說,代碼在離開if後,雖然已經離開了placeHolder的作用域,但在此之後,沒有任何對運行時棧的讀寫,placeHolder所在的索引還沒有被其他變量重用,所以GC判斷其爲存活。


爲了驗證這一推斷,我們在System.gc();之前再聲明一個變量,按照之前提到的“Java的棧優化”,這個變量會重用placeHolder的索引。

public static void main(String[] args{  
    if (true) {  
        byte[] placeHolder = new byte[64 * 1024 * 1024];  
        System.out.println(placeHolder.length / 1024);  
    }  
    int replacer = 1;  
    System.gc();  
}

看看其運行時棧:

LocalVariableTable:  
Start  Length  Slot  Name   Signature  
    0      23     0  args   [Ljava/lang/String;  
    5      12     1 placeHolder   [B  
   19       4     1 replacer   I

不出所料,replacer重用了placeHolder的索引。來看看GC情況:

65536  
[GC 68239K->65984K(125952K), 0.0011620 secs]  
[Full GC 65984K->345K(125952K), 0.0095220 secs]

placeHolder被成功回收了!我們的推斷也被驗證了。

再從運行時棧來看,加上int replacer = 1;和將placeHolder賦值爲null起到了同樣的作用:斷開堆中placeHolder和棧的聯繫,讓GC判斷placeHolder已經死亡。


現在算是理清了“不使用的對象應手動賦值爲null“的原理了,一切根源都是來自於JVM的一個“bug”:代碼離開變量作用域時,並不會自動切斷其與堆的聯繫。爲什麼這個“bug”一直存在?你不覺得出現這種情況的概率太小了麼?算是一個tradeoff了。


總結

希望看到這裏你已經明白了“不使用的對象應手動賦值爲null“這句話背後的奧義。我比較贊同《深入理解Java虛擬機》作者的觀點:在需要“不使用的對象應手動賦值爲null“時大膽去用,但不應當對其有過多依賴,更不能當作是一個普遍規則來推廣。


參考

  • 周志明. 深入理解Java虛擬機:JVM高級特性與最佳實踐[M]. 機械工業出版社, 2013.


都看到這裏了,點贊留言分享一下嘛!



掃碼關注最新動態
關鍵時刻,第一時間送達



- END -


本文分享自微信公衆號 - JAVA開發大本營(gh_42999193133a)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章