聽說又被 JVM 內存區域方面的面試題給虐了?

640?wx_fmt=png

來源:公衆號【JavaGuide】



寫在前面(常見面試題)

基本問題

介紹下 Java 內存區域(運行時數據區)Java 對象的創建過程(五步,建議能默寫出來並且要知道每一步虛擬機做了什麼)對象的訪問定位的兩種方式(句柄和直接指針兩種方式)

拓展問題

String類和常量池8種基本類型的包裝類和常量池


一、概述

對於 Java 程序員來說,在虛擬機自動內存管理機制下,不再需要像C/C++程序開發程序員這樣爲內一個 new 操作去寫對應的 delete/free 操作,不容易出現內存泄漏和內存溢出問題。正是因爲 Java 程序員把內存控制權利交給 Java 虛擬機,一旦出現內存泄漏和溢出方面的問題,如果不瞭解虛擬機是怎樣使用內存的,那麼排查錯誤將會是一個非常艱鉅的任務。


二、運行時數據區域

Java 虛擬機在執行 Java 程序的過程中會把它管理的內存劃分成若干個不同的數據區域。JDK. 1.8 和之前的版本略有不同,下面會介紹到。

JDK 1.8之前:

640?wx_fmt=png

JDK 1.8 :

640?wx_fmt=png

線程私有的:

程序計數器虛擬機棧本地方法棧

線程共享的:

方法區直接內存(非運行時數據區的一部分)

2.1 程序計數器

程序計數器是一塊較小的內存空間,可以看作是當前線程所執行的字節碼的行號指示器。字節碼解釋器工作時通過改變這個計數器的值來選取下一條需要執行的字節碼指令,分支、循環、跳轉、異常處理、線程恢復等功能都需要依賴這個計數器來完。

另外,爲了線程切換後能恢復到正確的執行位置,每條線程都需要有一個獨立的程序計數器,各線程之間計數器互不影響,獨立存儲,我們稱這類內存區域爲“線程私有”的內存。

從上面的介紹中我們知道程序計數器主要有兩個作用:

字節碼解釋器通過改變程序計數器來依次讀取指令,從而實現代碼的流程控制,如:順序執行、選擇、循環、異常處理。在多線程的情況下,程序計數器用於記錄當前線程執行的位置,從而當線程被切換回來的時候能夠知道該線程上次運行到哪兒了。

注意:程序計數器是唯一一個不會出現 OutOfMemoryError 的內存區域,它的生命週期隨着線程的創建而創建,隨着線程的結束而死亡。

2.2 Java 虛擬機棧

與程序計數器一樣,Java虛擬機棧也是線程私有的,它的生命週期和線程相同,描述的是 Java 方法執行的內存模型,每次方法調用的數據都是通過棧傳遞的。

Java 內存可以粗糙的區分爲堆內存(Heap)和棧內存(Stack),其中棧就是現在說的虛擬機棧,或者說是虛擬機棧中局部變量表部分。 (實際上,Java虛擬機棧是由一個個棧幀組成,而每個棧幀中都擁有:局部變量表、操作數棧、動態鏈接、方法出口信息。)

局部變量表主要存放了編譯器可知的各種數據類型(boolean、byte、char、short、int、float、long、double)、對象引用(reference類型,它不同於對象本身,可能是一個指向對象起始地址的引用指針,也可能是指向一個代表對象的句柄或其他與此對象相關的位置)。

Java 虛擬機棧會出現兩種異常:StackOverFlowError 和 OutOfMemoryError。

StackOverFlowError: 若Java虛擬機棧的內存大小不允許動態擴展,那麼當線程請求棧的深度超過當前Java虛擬機棧的最大深度的時候,就拋出StackOverFlowError異常。OutOfMemoryError: 若 Java 虛擬機棧的內存大小允許動態擴展,且當線程請求棧時內存用完了,無法再動態擴展了,此時拋出OutOfMemoryError異常。

Java 虛擬機棧也是線程私有的,每個線程都有各自的Java虛擬機棧,而且隨着線程的創建而創建,隨着線程的死亡而死亡。

擴展:那麼方法/函數如何調用?

Java 棧可用類比數據結構中棧,Java 棧中保存的主要內容是棧幀,每一次函數調用都會有一個對應的棧幀被壓入Java棧,每一個函數調用結束後,都會有一個棧幀被彈出。

Java方法有兩種返回方式:

return 語句。拋出異常。

不管哪種返回方式都會導致棧幀被彈出。

2.3 本地方法棧

和虛擬機棧所發揮的作用非常相似,區別是: 虛擬機棧爲虛擬機執行 Java 方法 (也就是字節碼)服務,而本地方法棧則爲虛擬機使用到的 Native 方法服務。 在 HotSpot 虛擬機中和 Java 虛擬機棧合二爲一。

本地方法被執行的時候,在本地方法棧也會創建一個棧幀,用於存放該本地方法的局部變量表、操作數棧、動態鏈接、出口信息。

方法執行完畢後相應的棧幀也會出棧並釋放內存空間,也會出現 StackOverFlowError 和 OutOfMemoryError 兩種異常。

2.4 堆

Java 虛擬機所管理的內存中最大的一塊,Java 堆是所有線程共享的一塊內存區域,在虛擬機啓動時創建。此內存區域的唯一目的就是存放對象實例,幾乎所有的對象實例以及數組都在這裏分配內存。

Java 堆是垃圾收集器管理的主要區域,因此也被稱作GC堆(Garbage Collected Heap).從垃圾回收的角度,由於現在收集器基本都採用分代垃圾收集算法,所以Java堆還可以細分爲:新生代和老年代:再細緻一點有:Eden空間、From Survivor、To Survivor空間等。進一步劃分的目的是更好地回收內存,或者更快地分配內存。

640?wx_fmt=png

上圖所示的 eden區、s0區、s1區都屬於新生代,tentired 區屬於老年代。大部分情況,對象都會首先在 Eden 區域分配,在一次新生代垃圾回收後,如果對象還存活,則會進入 s0 或者 s1,並且對象的年齡還會加 1(Eden區->Survivor 區後對象的初始年齡變爲1),當它的年齡增加到一定程度(默認爲15歲),就會被晉升到老年代中。對象晉升到老年代的年齡閾值,可以通過參數 -XX:MaxTenuringThreshold 來設置。

2.5 方法區

方法區與 Java 堆一樣,是各個線程共享的內存區域,它用於存儲已被虛擬機加載的類信息、常量、靜態變量、即時編譯器編譯後的代碼等數據。雖然Java虛擬機規範把方法區描述爲堆的一個邏輯部分,但是它卻有一個別名叫做 Non-Heap(非堆),目的應該是與 Java 堆區分開來。

HotSpot 虛擬機中方法區也常被稱爲 “永久代”,本質上兩者並不等價。僅僅是因爲 HotSpot 虛擬機設計團隊用永久代來實現方法區而已,這樣 HotSpot 虛擬機的垃圾收集器就可以像管理 Java 堆一樣管理這部分內存了。但是這並不是一個好主意,因爲這樣更容易遇到內存溢出問題。

相對而言,垃圾收集行爲在這個區域是比較少出現的,但並非數據進入方法區後就“永久存在”了。

JDK 1.8 的時候,方法區被徹底移除了(JDK1.7就已經開始了),取而代之是元空間,元空間使用的是直接內存。

我們可以使用參數: -XX:MetaspaceSize 來指定元數據區的大小。與永久區很大的不同就是,如果不指定大小的話,隨着更多類的創建,虛擬機會耗盡所有可用的系統內存。

2.6 運行時常量池

運行時常量池是方法區的一部分。Class 文件中除了有類的版本、字段、方法、接口等描述信息外,還有常量池信息(用於存放編譯期生成的各種字面量和符號引用)

既然運行時常量池時方法區的一部分,自然受到方法區內存的限制,當常量池無法再申請到內存時會拋出 OutOfMemoryError 異常。

JDK1.7及之後版本的 JVM 已經將運行時常量池從方法區中移了出來,在 Java 堆(Heap)中開闢了一塊區域存放運行時常量池。

640?wx_fmt=png——圖片來源:https://blog.csdn.net/wangbiao007/article/details/78545189[1]

2.7 直接內存

直接內存並不是虛擬機運行時數據區的一部分,也不是虛擬機規範中定義的內存區域,但是這部分內存也被頻繁地使用。而且也可能導致 OutOfMemoryError 異常出現。

JDK1.4 中新加入的 NIO(New Input/Output) 類,引入了一種基於通道(Channel) 與緩存區(Buffer) 的 I/O 方式,它可以直接使用 Native 函數庫直接分配堆外內存,然後通過一個存儲在 Java 堆中的 DirectByteBuffer 對象作爲這塊內存的引用進行操作。這樣就能在一些場景中顯著提高性能,因爲避免了在 Java 堆和 Native 堆之間來回複製數據

本機直接內存的分配不會收到 Java 堆的限制,但是,既然是內存就會受到本機總內存大小以及處理器尋址空間的限制。


三、HotSpot 虛擬機對象探祕

通過上面的介紹我們大概知道了虛擬機的內存情況,下面我們來詳細的瞭解一下 HotSpot 虛擬機在 Java 堆中對象分配、佈局和訪問的全過程。

3.1 對象的創建

下圖便是 Java 對象的創建過程,我建議最好是能默寫出來,並且要掌握每一步在做什麼。640?wx_fmt=png

①類加載檢查: 虛擬機遇到一條 new 指令時,首先將去檢查這個指令的參數是否能在常量池中定位到這個類的符號引用,並且檢查這個符號引用代表的類是否已被加載過、解析和初始化過。如果沒有,那必須先執行相應的類加載過程。

②分配內存: 在類加載檢查通過後,接下來虛擬機將爲新生對象分配內存。對象所需的內存大小在類加載完成後便可確定,爲對象分配空間的任務等同於把一塊確定大小的內存從 Java 堆中劃分出來。分配方式有 “指針碰撞” 和 “空閒列表” 兩種,選擇那種分配方式由 Java 堆是否規整決定,而Java堆是否規整又由所採用的垃圾收集器是否帶有壓縮整理功能決定

內存分配的兩種方式:(補充內容,需要掌握)

選擇以上兩種方式中的哪一種,取決於 Java 堆內存是否規整。而 Java 堆內存是否規整,取決於 GC 收集器的算法是"標記-清除",還是"標記-整理"(也稱作"標記-壓縮"),值得注意的是,複製算法內存也是規整的

640?wx_fmt=png

內存分配併發問題(補充內容,需要掌握)

在創建對象的時候有一個很重要的問題,就是線程安全,因爲在實際開發過程中,創建對象是很頻繁的事情,作爲虛擬機來說,必須要保證線程是安全的,通常來講,虛擬機採用兩種方式來保證線程安全:

CAS+失敗重試: CAS 是樂觀鎖的一種實現方式。所謂樂觀鎖就是,每次不加鎖而是假設沒有衝突而去完成某項操作,如果因爲衝突失敗就重試,直到成功爲止。虛擬機採用 CAS 配上失敗重試的方式保證更新操作的原子性。TLAB: 爲每一個線程預先在Eden區分配一塊兒內存,JVM在給線程中的對象分配內存時,首先在TLAB分配,當對象大於TLAB中的剩餘內存或TLAB的內存已用盡時,再採用上述的CAS進行內存分配

③初始化零值: 內存分配完成後,虛擬機需要將分配到的內存空間都初始化爲零值(不包括對象頭),這一步操作保證了對象的實例字段在 Java 代碼中可以不賦初始值就直接使用,程序能訪問到這些字段的數據類型所對應的零值。

④設置對象頭: 初始化零值完成之後,虛擬機要對對象進行必要的設置,例如這個對象是那個類的實例、如何才能找到類的元數據信息、對象的哈希嗎、對象的 GC 分代年齡等信息。 這些信息存放在對象頭中。 另外,根據虛擬機當前運行狀態的不同,如是否啓用偏向鎖等,對象頭會有不同的設置方式。

⑤執行 init 方法: 在上面工作都完成之後,從虛擬機的視角來看,一個新的對象已經產生了,但從 Java 程序的視角來看,對象創建纔剛開始,<init> 方法還沒有執行,所有的字段都還爲零。所以一般來說,執行 new 指令之後會接着執行 <init> 方法,把對象按照程序員的意願進行初始化,這樣一個真正可用的對象纔算完全產生出來。

3.2 對象的內存佈局

在 Hotspot 虛擬機中,對象在內存中的佈局可以分爲3塊區域:對象頭實例數據對齊填充

Hotspot虛擬機的對象頭包括兩部分信息第一部分用於存儲對象自身的自身運行時數據(哈希碼、GC分代年齡、鎖狀態標誌等等),另一部分是類型指針,即對象指向它的類元數據的指針,虛擬機通過這個指針來確定這個對象是那個類的實例。

實例數據部分是對象真正存儲的有效信息,也是在程序中所定義的各種類型的字段內容。

對齊填充部分不是必然存在的,也沒有什麼特別的含義,僅僅起佔位作用。 因爲Hotspot虛擬機的自動內存管理系統要求對象起始地址必須是8字節的整數倍,換句話說就是對象的大小必須是8字節的整數倍。而對象頭部分正好是8字節的倍數(1倍或2倍),因此,當對象實例數據部分沒有對齊時,就需要通過對齊填充來補全。

3.3 對象的訪問定位

建立對象就是爲了使用對象,我們的Java程序通過棧上的 reference 數據來操作堆上的具體對象。對象的訪問方式有虛擬機實現而定,目前主流的訪問方式有①使用句柄②直接指針兩種:

句柄: 如果使用句柄的話,那麼Java堆中將會劃分出一塊內存來作爲句柄池,reference 中存儲的就是對象的句柄地址,而句柄中包含了對象實例數據與類型數據各自的具體地址信息;

640?wx_fmt=png

  • 直接指針 如果使用直接指針訪問,那麼 Java 堆對象的佈局中就必須考慮如何放置訪問類型數據的相關信息,而reference 中存儲的直接就是對象的地址。

640?wx_fmt=png

這兩種對象訪問方式各有優勢。使用句柄來訪問的最大好處是 reference 中存儲的是穩定的句柄地址,在對象被移動時只會改變句柄中的實例數據指針,而 reference 本身不需要修改。使用直接指針訪問方式最大的好處就是速度快,它節省了一次指針定位的時間開銷。


四、重點補充內容

String 類和常量池

1 String 對象的兩種創建方式:

     String str1 = "abcd";	
     String str2 = new String("abcd");	
     System.out.println(str1==str2);//false

這兩種不同的創建方法是有差別的,第一種方式是在常量池中拿對象,第二種方式是直接在堆內存空間創建一個新的對象。640?wx_fmt=png記住:只要使用new方法,便需要創建新的對象。

2 String 類型的常量池比較特殊。它的主要使用方法有兩種:

直接使用雙引號聲明出來的 String 對象會直接存儲在常量池中。如果不是用雙引號聲明的 String 對象,可以使用 String 提供的 intern 方法。String.intern() 是一個 Native 方法,它的作用是:如果運行時常量池中已經包含一個等於此 String 對象內容的字符串,則返回常量池中該字符串的引用;如果沒有,則在常量池中創建與此 String 內容相同的字符串,並返回常量池中創建的字符串的引用。

          String s1 = new String("計算機");	
          String s2 = s1.intern();	
          String s3 = "計算機";	
          System.out.println(s2);//計算機	
          System.out.println(s1 == s2);//false,因爲一個是堆內存中的String對象一個是常量池中的String對象,	
          System.out.println(s3 == s2);//true,因爲兩個都是常量池中的String對象

3 String 字符串拼接

          String str1 = "str";	
          String str2 = "ing";	
	
          String str3 = "str" + "ing";//常量池中的對象	
          String str4 = str1 + str2; //在堆上創建的新的對象      	
          String str5 = "string";//常量池中的對象	
          System.out.println(str3 == str4);//false	
          System.out.println(str3 == str5);//true	
          System.out.println(str4 == str5);//false

640?wx_fmt=png

儘量避免多個字符串拼接,因爲這樣會重新創建對象。如果需要改變字符串的話,可以使用 StringBuilder 或者 StringBuffer。

String s1 = new String("abc");這句話創建了幾個對象?

創建了兩個對象。

驗證:

        String s1 = new String("abc");// 堆內存的地址值	
        String s2 = "abc";	
        System.out.println(s1 == s2);// 輸出false,因爲一個是堆內存,一個是常量池的內存,故兩者是不同的。	
        System.out.println(s1.equals(s2));// 輸出true

結果:

false	
true

解釋:

先有字符串"abc"放入常量池,然後 new 了一份字符串"abc"放入Java堆(字符串常量"abc"在編譯期就已經確定放入常量池,而 Java 堆上的"abc"是在運行期初始化階段才確定),然後 Java 棧的 str1 指向Java堆上的"abc"。

8種基本類型的包裝類和常量池

Java 基本類型的包裝類的大部分都實現了常量池技術,即Byte,Short,Integer,Long,Character,Boolean;這5種包裝類默認創建了數值[-128,127]的相應類型的緩存數據,但是超出此範圍仍然會去創建新的對象。兩種浮點數類型的包裝類 Float,Double 並沒有實現常量池技術。

        Integer i1 = 33;	
        Integer i2 = 33;	
        System.out.println(i1 == i2);// 輸出true	
        Integer i11 = 333;	
        Integer i22 = 333;	
        System.out.println(i11 == i22);// 輸出false	
        Double i3 = 1.2;	
        Double i4 = 1.2;	
        System.out.println(i3 == i4);// 輸出false

Integer 緩存源代碼:

/**	
*此方法將始終緩存-128到127(包括端點)範圍內的值,並可以緩存此範圍之外的其他值。	
*/	
    public static Integer valueOf(int i) {	
        if (i >= IntegerCache.low && i <= IntegerCache.high)	
            return IntegerCache.cache[i + (-IntegerCache.low)];	
        return new Integer(i);	
    }	

應用場景:

Integer i1=40;Java 在編譯的時候會直接將代碼封裝成Integer i1=Integer.valueOf(40);,從而使用常量池中的對象。Integer i1 = new Integer(40);這種情況下會創建新的對象。

  Integer i1 = 40;	
  Integer i2 = new Integer(40);	
  System.out.println(i1==i2);//輸出false

Integer比較更豐富的一個例子:

  Integer i1 = 40;	
  Integer i2 = 40;	
  Integer i3 = 0;	
  Integer i4 = new Integer(40);	
  Integer i5 = new Integer(40);	
  Integer i6 = new Integer(0);	
	
  System.out.println("i1=i2   " + (i1 == i2));	
  System.out.println("i1=i2+i3   " + (i1 == i2 + i3));	
  System.out.println("i1=i4   " + (i1 == i4));	
  System.out.println("i4=i5   " + (i4 == i5));	
  System.out.println("i4=i5+i6   " + (i4 == i5 + i6));   	
  System.out.println("40=i5+i6   " + (40 == i5 + i6));     

結果:

i1=i2   true	
i1=i2+i3   true	
i1=i4   false	
i4=i5   false	
i4=i5+i6   true	
40=i5+i6   true

解釋:

語句i4 == i5 + i6,因爲+這個操作符不適用於Integer對象,首先i5和i6進行自動拆箱操作,進行數值相加,即i4 == 40。然後Integer對象無法與數值進行直接比較,所以i4自動拆箱轉爲int值40,最終這條語句轉爲40 == 40進行數值比較。

References

《深入理解Java虛擬機:JVM高級特性與最佳實踐(第二版》《實戰java虛擬機》https://www.cnblogs.com/CZDblog/p/5589379.html[1]https://www.cnblogs.com/java-zhao/p/5180492.html[2]https://blog.csdn.net/qq_26222859/article/details/73135660[3]https://blog.csdn.net/cugwuhan2014/article/details/78038254[4]

(完)


往期閱讀
640?wx_fmt=png


狗屎一樣的代碼!快,重構我!

阿里面試,我掛在了第四輪……

同樣是程序員,爲什麼別人比你更優秀?

我是如何從通信轉到Java軟件開發工程師的?

2018年所有精華文章彙總,錯過了血虧!



關注我

每天進步一點點


640?wx_fmt=png


點贊是最大的支持 640?wx_fmt=gif


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章