JVM源碼分析之堆外內存完全解讀1

原文鏈接:https://mp.weixin.qq.com/s?__biz=MzIzNjI1ODc2OA==&mid=403168235&idx=1&sn=ecc804ba7231996d43c05138566d074a&scene=19#wechat_redirect

概述

廣義的堆外內存

說到堆外內存,那大家肯定想到堆內內存,這也是我們大家接觸最多的,我們在jvm參數裏通常設置-Xmx來指定我們的堆的最大值,不過這還不是我們理解的Java堆,-Xmx的值是新生代和老生代的和的最大值,我們在jvm參數裏通常還會加一個參數-XX:MaxPermSize來指定持久代的最大值,那麼我們認識的Java堆的最大值其實是-Xmx和-XX:MaxPermSize的總和,在分代算法下,新生代,老生代和持久代是連續的虛擬地址,因爲它們是一起分配的,那麼剩下的都可以認爲是堆外內存(廣義的)了,這些包括了jvm本身在運行過程中分配的內存,codecache,jni裏分配的內存,DirectByteBuffer分配的內存等等

狹義的堆外內存

而作爲java開發者,我們常說的堆外內存溢出了,其實是狹義的堆外內存,這個主要是指java.nio.DirectByteBuffer在創建的時候分配內存,我們這篇文章裏也主要是講狹義的堆外內存,因爲它和我們平時碰到的問題比較密切

JDK/JVM裏DirectByteBuffer的實現

DirectByteBuffer通常用在通信過程中做緩衝池,在mina,netty等nio框架中屢見不鮮,先來看看JDK裏的實現:


通過上面的構造函數我們知道,真正的內存分配是使用的Bits.reserveMemory方法


通過上面的代碼我們知道可以通過-XX:MaxDirectMemorySize來指定最大的堆外內存,那麼我們首先引入兩個問題

  • 堆外內存默認是多大

  • 爲什麼要主動調用System.gc()

堆外內存默認是多大

如果我們沒有通過-XX:MaxDirectMemorySize來指定最大的堆外內存,那麼默認的最大堆外內存是多少呢,我們還是通過代碼來分析

上面的代碼裏我們看到調用了sun.misc.VM.maxDirectMemory()


看到上面的代碼之後是不是誤以爲默認的最大值是64M?其實不是的,說到這個值得從java.lang.System這個類的初始化說起


上面這個方法在jvm啓動的時候對System這個類做初始化的時候執行的,因此執行時間非常早,我們看到裏面調用了sun.misc.VM.saveAndRemoveProperties(props):


如果我們通過-Dsun.nio.MaxDirectMemorySize指定了這個屬性,只要它不等於-1,那效果和加了-XX:MaxDirectMemorySize一樣的,如果兩個參數都沒指定,那麼最大堆外內存的值來自於directMemory = Runtime.getRuntime().maxMemory(),這是一個native方法


其中在我們使用CMS GC的情況下的實現如下,其實是新生代的最大值-一個survivor的大小+老生代的最大值,也就是我們設置的-Xmx的值裏除去一個survivor的大小就是默認的堆外內存的大小了

爲什麼要主動調用System.gc

既然要調用System.gc,那肯定是想通過觸發一次gc操作來回收堆外內存,不過我想先說的是堆外內存不會對gc造成什麼影響(這裏的System.gc除外),但是堆外內存的回收其實依賴於我們的gc機制,首先我們要知道在java層面和我們在堆外分配的這塊內存關聯的只有與之關聯的DirectByteBuffer對象了,它記錄了這塊內存的基地址以及大小,那麼既然和gc也有關,那就是gc能通過操作DirectByteBuffer對象來間接操作對應的堆外內存了。DirectByteBuffer對象在創建的時候關聯了一個PhantomReference,說到PhantomReference它其實主要是用來跟蹤對象何時被回收的,它不能影響gc決策,但是gc過程中如果發現某個對象除了只有PhantomReference引用它之外,並沒有其他的地方引用它了,那將會把這個引用放到java.lang.ref.Reference.pending隊列裏,在gc完畢的時候通知ReferenceHandler這個守護線程去執行一些後置處理,而DirectByteBuffer關聯的PhantomReference是PhantomReference的一個子類,在最終的處理裏會通過Unsafe的free接口來釋放DirectByteBuffer對應的堆外內存塊

JDK裏ReferenceHandler的實現:


可見如果pending爲空的時候,會通過lock.wait()一直等在那裏,其中喚醒的動作是在jvm裏做的,當gc完成之後會調用如下的方法VM_GC_Operation::doit_epilogue(),在方法末尾會調用lock的notify操作,至於pending隊列什麼時候將引用放進去的,其實是在gc的引用處理邏輯中放進去的,針對引用的處理後面可以專門寫篇文章來介紹


對於System.gc的實現,之前寫了一篇文章來重點介紹,JVM源碼分析之SystemGC完全解讀,它會對新生代的老生代都會進行內存回收,這樣會比較徹底地回收DirectByteBuffer對象以及他們關聯的堆外內存,我們dump內存發現DirectByteBuffer對象本身其實是很小的,但是它後面可能關聯了一個非常大的堆外內存,因此我們通常稱之爲『冰山對象』,我們做ygc的時候會將新生代裏的不可達的DirectByteBuffer對象及其堆外內存回收了,但是無法對old裏的DirectByteBuffer對象及其堆外內存進行回收,這也是我們通常碰到的最大的問題,如果有大量的DirectByteBuffer對象移到了old,但是又一直沒有做cms gc或者full gc,而只進行ygc,那麼我們的物理內存可能被慢慢耗光,但是我們還不知道發生了什麼,因爲heap明明剩餘的內存還很多(前提是我們禁用了System.gc)。

爲什麼要使用堆外內存

DirectByteBuffer在創建的時候會通過Unsafe的native方法來直接使用malloc分配一塊內存,這塊內存是heap之外的,那麼自然也不會對gc造成什麼影響(System.gc除外),因爲gc耗時的操作主要是操作heap之內的對象,對這塊內存的操作也是直接通過Unsafe的native方法來操作的,相當於DirectByteBuffer僅僅是一個殼,還有我們通信過程中如果數據是在Heap裏的,最終也還是會copy一份到堆外,然後再進行發送,所以爲什麼不直接使用堆外內存呢。對於需要頻繁操作的內存,並且僅僅是臨時存在一會的,都建議使用堆外內存,並且做成緩衝池,不斷循環利用這塊內存。

爲什麼不能大面積使用堆外內存

如果我們大面積使用堆外內存並且沒有限制,那遲早會導致內存溢出,畢竟程序是跑在一臺資源受限的機器上,因爲這塊內存的回收不是你直接能控制的,當然你可以通過別的一些途徑,比如反射,直接使用Unsafe接口等,但是這些務必給你帶來了一些煩惱,Java與生俱來的優勢被你完全拋棄了—開發不需要關注內存的回收,由gc算法自動去實現。另外上面的gc機制與堆外內存的關係也說了,如果一直觸發不了cms gc或者full gc,那麼後果可能很嚴重。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章