Java堆、棧和常量池以及相關String的詳細講解(經典中的經典)

Java堆、棧和常量池以及相關String的詳細講解(經典中的經典)

 

博客分類: Java綜合  

一:在JAVA中,有六個不同的地方可以存儲數據:  

1. 寄存器(register)。 這是最快的存儲區,因爲它位於不同於其他存儲區的地方——處理器內部。但是寄存器的數量極其有限,所以寄存器由編譯器根據需求進行分配。你不能直接控制,也不能在程序中感覺到寄存器存在的任何跡象。    

------最快的存儲區, 由編譯器根據需求進行分配,我們在程序中無法控制.

2. 堆棧(stack)。位於通用RAM中,但通過它的“堆棧指針”可以從處理器哪裏獲得支持。堆棧指針若向下移動,則分配新的內存;若向上移動,則釋放那些 內存。這是一種快速有效的分配存儲方法,僅次於寄存器。創建程序時候,JAVA編譯器必須知道存儲在堆棧內所有數據的確切大小和生命週期,因爲它必須生成 相應的代碼,以便上下移動堆棧指針。這一約束限制了程序的靈活性,所以雖然某些JAVA數據存儲在堆棧中——特別是對象引用,但是JAVA對象不存儲其 中。    

------存放基本類型的變量數據和對象,數組的引用,但對象本身不存放在棧中,而是存放在堆(new 出來的對象)或者常量池中(字符串常量對象存放在常量池中)

3. 堆(heap)。一種通用性的內存池(也存在於RAM中),用於存放所以的JAVA對象。堆不同於堆棧的好處是:編譯器不需要知道要從堆裏分配多少存儲區 域,也不必知道存儲的數據在堆裏存活多長時間。因此,在堆裏分配存儲有很大的靈活性。當你需要創建一個對象的時候,只需要new寫一行簡單的代碼,當執行 這行代碼時,會自動在堆裏進行存儲分配。當然,爲這種靈活性必須要付出相應的代碼。用堆進行存儲分配比用堆棧進行存儲存儲需要更多的時間。  

------存放所有new出來的對象。

4. 靜態存儲(static storage)。這裏的“靜態”是指“在固定的位置”。靜態存儲裏存放程序運行時一直存在的數據。你可用關鍵字static來標識一個對象的特定元素是靜態的,但JAVA對象本身從來不會存放在靜態存儲空間裏。  

------存放靜態成員(static定義的)

5. 常量存儲(constant storage)。常量值通常直接存放在程序代碼內部,這樣做是安全的,因爲它們永遠不會被改變。有時,在嵌入式系統中,常量本身會和其他部分分割離開,所以在這種情況下,可以選擇將其放在ROM中  

------存放字符串常量和基本類型常量(public static final)

6. 非RAM存儲。如果數據完全存活於程序之外,那麼它可以不受程序的任何控制,在程序沒有運行時也可以存在。  

------硬盤等永久存儲空間 就速度來說,有如下關係:

    寄存器 >堆棧 > 堆 > 其它

    這裏我們主要關心棧,堆和常量池,對於棧和常量池中的對象可以共享,對於堆中的對象不可以共享。

     棧中的數據大小和生命週期是可以確定的,當沒有引用指向數據時,這個數據就會消失。堆中的對象的由垃圾回收器負責回收,因此大小和生命週期不需要確定,具有很大的靈活性。    

    對於字符串:其對象的引用都是存儲在棧中的,如果是編譯期已經創建好(直接用雙引號定義的)的就存儲在常量池中,如果是運行期(new出來的)才能確定的就存儲在堆中。對於equals相等的字符串,在常量池中永遠只有一份,在堆中有多份。

     如以下代碼: Java代碼 

        String s1 = "china"; 

        String s2 = "china";

        String s3 = "china"; 

        String ss1 = new String("china"); 

        String ss2 = new String("china"); 

        String ss3 = new String("china");   

        這裏解釋一下,對於通過 new 產生一個字符串(假設爲 ”china” )時,會先去常量池中查找是否已經有了 ”china” 對象,如果沒有則在常量池中創建一個此字符串對象,然後堆中再創建一個常量池中此 ”china” 對象的拷貝對象。

        也就是有道面試題: String s = new String(“xyz”); 產生幾個對象?

         一個或兩個。如果常量池中原來沒有 ”xyz”, 就是兩個。如果原來的常量池中存在“xyz”時,就是一個。

        對於基礎類型的變量和常量:變量和引用存儲在棧中,常量存儲在常量池中。

        如以下代碼: Java代碼 

        int i1 = 9; 

        int i2 = 9; 

        int i3 = 9;  

        public static final int INT1 = 9; 

        public static final int INT2 = 9; 

        public static final int INT3 = 9;   

        對於成員變量和局部變量:成員變量就是方法外部,類的內部定義的變量;

     局部變量就是方法或語句塊內部定義的變量。局部變量必須初始化。 形式參數是局部變量,局部變量的數據存在於棧內存中。棧內存中的局部變量隨着方法的消失而消失。 成員變量存儲在堆中的對象裏面,由垃圾回收器負責回收。

     如以下代碼: Java代碼  

     class BirthDate {     

       private int day;     

       private int month;     

       private int year;         

       public BirthDate(int d, int m, int y) {         

                   day = d;          

                   month = m;          

                    year = y;     

                   }     

     // 省略get,set方法……… 

  }   

 

 public class Test{     

    public static void main(String args[]){ 

      int date = 9;         

      Test test = new Test();                  

      test.change(date);          

      BirthDate d1= new BirthDate(7,7,1970);            

    }         

  public void change1(int i){         

        i = 1234;     

    }   

  對於以上這段代碼,date爲局部變量,i,d,m,y都是形參爲局部變量,day,month,year爲成員變量。

  下面分析一下代碼執行時候的變化:

  1. main方法開始執行:int date = 9; date局部變量,基礎類型,引用和值都存在棧中。

  2. Test test = new Test(); test爲對象引用,存在棧中,對象(new Test())存在堆中。

  3. test.change(date); i爲局部變量,引用和值存在棧中。當方法change執行完成後,i就會從棧中消失。

  4. BirthDate d1= new BirthDate(7,7,1970);  d1 爲對象引用,存在棧中,對象(new BirthDate())存在堆中,其中d,m,y爲局部變量存儲在棧中,且它們的類型爲基礎類型,因此它們的數據也存儲在棧中。 day,month,year爲成員變量,它們存儲在堆中(new BirthDate()裏面)。當BirthDate構造方法執行完之後,d,m,y將從棧中消失。

  5.main方法執行完之後,date變量,test,d1引用將從棧中消失,new Test(),new BirthDate()將等待垃圾回收。

 

Java堆、棧和常量池詳解(二)

1. 棧(stack)與堆(heap)都是Java用來在RAM中存放數據的地方。與C++不同,Java自動管理棧和堆,程序員不能直接地設置棧或堆。

2. 棧的優勢是,存取速度比堆要快,僅次於直接位於CPU中的寄存器。但缺點是,存在棧中的數據大小與生存期必須是確定的,缺乏靈活性。另外,棧數據可以共 享,詳見第3點。    

    堆的優勢是可以動態地分配內存大小,生存期也不必事先告訴編譯器,Java的垃圾收集器會自動收走這些不再使用的數據。但缺點是,由於要 在運行時動態分配內存,存取速度較慢。

3. Java中的數據類型有兩種。

 一種是基本類型(primitive types), 共有8種,即int, short, long, byte, float, double, boolean, char(注意,並沒有string的基本類型)。這種類型的定義是通過諸如int a = 3; long b = 255L;的形式來定義的,稱爲自動變量。值得注意的是,自動變量存的是字面值,不是類的實例,即不是類的引用,這裏並沒有類的存在。如int a = 3; 這裏的a是一個指向int類型的引用,指向3這個字面值。這些字面值的數據,由於大小可知,生存期可知(這些字面值固定定義在某個程序塊裏面,程序塊退出 後,字段值就消失了),出於追求速度的原因,就存在於棧中。 另外,棧有一個很重要的特殊性,就是存在棧中的數據可以共享。假設我們同時定義   int a = 3;   int b = 3; 編 譯器先處理int a = 3;首先它會在棧中創建一個變量爲a的引用,然後查找有沒有字面值爲3的地址,沒找到,就開闢一個存放3這個字面值的地址,然後將a指向3的地址。接着處 理int b = 3;在創建完b的引用變量後,由於在棧中已經有3這個字面值,便將b直接指向3的地址。這樣,就出現了a與b同時均指向3的情況。 特 別注意的是,這種字面值的引用與類對象的引用不同。假定兩個類對象的引用同時指向一個對象,如果一個對象引用變量修改了這個對象的內部狀態,那麼另一個對 象引用變量也即刻反映出這個變化。相反,通過字面值的引用來修改其值,不會導致另一個指向此字面值的引用的值也跟着改變的情況。如上例,我們定義完a與 b的值後,再令a=4;那麼,b不會等於4,還是等於3。在編譯器內部,遇到a=4;時,它就會重新搜索棧中是否有4的字面值,如果沒有,重新開闢地址存 放4的值;如果已經有了,則直接將a指向這個地址。因此a值的改變不會影響到b的值。

   另一種是包裝類數據,如Integer, String, Double等將相應的基本數據類型包裝起來的類。這些類數據全部存在於堆中,Java用new()語句來顯示地告訴編譯器,在運行時才根據需要動態創建,因此比較靈活,但缺點是要佔用更多的時間。  

   舉例如下: Java代碼 

   public class Test {       

    public static void main(String[] args)       

    {   

        int a1=1;         

        int b1=1;         

        int c1=2;         

        int d1=a1+b1;         

        Integer a = 1;           

        Integer b = 2;           

        Integer c = 3;           

        Integer d = 3;           

        Integer e = 321;           

        Integer f = 321;

        Long g = 3L;  

       System.out.println(a1==b1);   //true  結果1           

       System.out.println(c1==d1);   //true  結果2         

       System.out.println(c==d);   //true  結果3            

       System.out.println(e==f);   //false  結果4          

      }  

  }   

 分析:

   結果1:a1==b1如上面所述,會在棧 中開闢存儲空間存放數據。          

   結果2:首先它會在棧 中創建一個變量爲c1的引用,然後查找有沒有字面值爲2的地址,沒找到,就開闢一個存放2這個字面值的地址,然後將c1指向2的地址,d1爲兩個字面值相加也爲2, 由於在棧中已經有2這個字面值,便將d1直接指向2的地址。這樣,就出現了c1與d1同時均指向3的情況。           在分析下面結果以前讓我們先對Java自動拆箱和裝箱做個了結:在自動裝箱時,把int變成Integer的時候,是有規則的,當你的int的值在-128-IntegerCache.high(127) 時,返回的不是一個新new出來的Integer對象,而是一個已經緩存在堆 中的Integer對象,(我們可以這樣理解,系統已經把-128到127之 間的Integer緩存到一個Integer數組中去了,如果你要把一個int變成一個Integer對象,首先去緩存中找,找到的話直接返回引用給你就 行了,不必再新new一個),如果不在-128-IntegerCache.high(127) 時會返回一個新new出來的Integer對象。           

  結果3:由於3是在範圍內所以是從緩存中取數據的,c和d指向同一個對象,結果爲true;         

  結果4:由於321不是在範圍內所以不是從緩存中取數據的而是單獨有new對象,e和f並沒有指向同一個對象,結果爲false;  

  4. String是一個特殊的包裝類數據。即可以用String str = new String("abc");的形式來創建,也可以用String str = "abc";的形式來創建(作爲對比,在JDK 5.0之前,你從未見過Integer i = 3;的表達式,因爲類與字面值是不能通用的,除了String。而在JDK 5.0中,這種表達式是可以的!因爲編譯器在後臺進行Integer i = new Integer(3)的轉換)。前者是規範的類的創建過程,即在Java中,一切都是對象,而對象是類的實例,全部通過new()的形式來創建。Java 中的有些類,如DateFormat類,可以通過該類的getInstance()方法來返回一個新創建的類,似乎違反了此原則。其實不然。該類運用了單 例模式來返回類的實例,只不過這個實例是在該類內部通過new()來創建的,而getInstance()向外部隱藏了此細節。那爲什麼在String str = "abc";中,並沒有通過new()來創建實例,是不是違反了上述原則?其實沒有。

   4(1)String str = "abc"創建對象的過程 1 首先在常量池中查找是否存在內容爲"abc"字符串對象 2 如果不存在則在常量池中創建"abc",並讓str引用該對象 3 如果存在則直接讓str引用該對象

至 於"abc"是怎麼保存,保存在哪?常量池屬於類信息的一部分,而類信息反映到JVM內存模型中是對應存在於JVM內存模型的方法區,也就是說這個類信息 中的常量池概念是存在於在方法區中,而方法區是在JVM內存模型中的堆中由JVM來分配的,所以"abc"可以說存在於堆中(而有些資料,爲了把方法區的 堆區別於JVM的堆,把方法區稱爲棧)。一般這種情況下,"abc"在編譯時就被寫入字節碼中,所以class被加載時,JVM就爲"abc"在常量池中 分配內存,所以和靜態區差不多。  

   4(2)String str = new String("abc")創建實例的過程 1 首先在堆中(不是常量池)創建一個指定的對象"abc",並讓str引用指向該對象 2 在字符串常量池中查看,是否存在內容爲"abc"字符串對象 3 若存在,則將new出來的字符串對象與字符串常量池中的對象聯繫起來 4 若不存在,則在字符串常量池中創建一個內容爲"abc"的字符串對象,並將堆中的對象與之聯繫起來 intern 方法可以返回該字符串在常量池中的對象的引用,可以通過下面代碼簡單的測試 Java代碼 

  class StringTest {     

   public static void main(String[] args) {         

    String str1 = "abc";         

    String str2 = new String("abc").intern();         

    System.out.println(str1==str2);     

  } 

  一個初始爲空的字符串池,它由類 String 私有地維護。 當調用 intern 方法時,如果池已經包含一個等於此 String 對象的字符串(用 equals(Object) 方法確定),則返回池中的字符串。否則,將此 String 對象添加到池中,並返回此 String 對象的引用。 它遵循以下規則:對於任意兩個字符串 s 和 t ,當且僅當  s.equals(t) 爲 true 時,s.intern() == t.intern() 才爲 true 。   所以String str1 = "abc",str1引用的是常量池(方法區)的對象,而String str2 = new String("abc"),str2引用的是堆中的對象,所以內存地址不一樣,但是內容一樣,所以==爲false,而equals是true

4(3)String str1 = "abc"; String str2 = "ab" + "c"; str1==str2是ture 是因爲String str2 = "ab" + "c"會查找常量池中時候存在內容爲"abc"字符串對象,如存在則直接讓str2引用該對象,顯然String str1 = "abc"的時候,上面說了,會在常量池中創建"abc"對象,所以str1引用該對象,str2也引用該對象,所以str1==str2

4(4)String str1 = "abc"; String str2 = "ab"; String str3 = str2 + "c"; str1==str3是false 是因爲String str3 = str2 + "c"涉及到變量(不全是常量)的相加,所以會生成新的對象,其內部實現是先new一個StringBuilder,然後 append(str2),append("c");然後讓str3引用toString()返回的對象 如果想了解更多的細節,可以自己查看反編譯的代碼,查看反編譯代碼可以用javap,

 即 javap -c -verbose 要查看的類文件(.class不要)

比如上面的代碼的示例

javac StringTest.java //編譯

javap -c -verbose StringTest //反編譯

4(5)String str1 = "abc";

      String str2 = "abc";

     System.out.println(str1==str2);  //true 注意,

     我們這裏並不用str1.equals(str2);的方式,因爲這將比較兩個字符串的值是否相等。==號,根據JDK的說明,只有在兩個引用都指向了同一個對象時才返回真值。而我們在這裏要看的是,str1與str2是否都指向了同一個對象。 結果說明,JVM創建了兩個引用str1和str2,但只創建了一個對象,而且兩個引用都指向了這個對象。

4(6)String str1 = "abc";

      String str2 = "abc";

       str1 = "bcd";

       System.out.println(str1 + "," + str2);  //bcd, abc      

       System.out.println(str1==str2);  //false 這就是說,賦值的變化導致了類對象引用的變化,str1指向了另外一個新對象!而str2仍舊指向原來的對象。上例中,當我們將str1的值改爲"bcd"時,JVM發現在 常量池中沒有存放該值的地址,便開闢了這個地址,並創建了一個新的對象,其字符串的值指向這個地址。 事 實上,String類被設計成爲不可改變(immutable)的類。如果你要改變其值,可以,但JVM在運行時根據新值悄悄創建了一個新對象,然後將這 個對象的地址返回給原來類的引用。這個創建過程雖說是完全自動進行的,但它畢竟佔用了更多的時間。在對時間要求比較敏感的環境中,會帶有一定的不良影響。

 4(7)

     String str1 = "abc";

     String str2 = "abc";

               str1 = "bcd";      

     String str3 = str1;      

     System.out.println(str3);  //bcd      

     String str4 = "bcd";    

     System.out.println(str1 == str4);  //true str3 這個對象的引用直接指向str1所指向的對象(注意,str3並沒有創建新對象)。當str1改完其值後,再創建一個String的引用str4,並指向 因str1修改值而創建的新的對象。可以發現,這回str4也沒有創建新的對象,從而再次實現棧中數據的共享。

 4(8)

   我們再接着看以下的代碼。  

  String str1 = new String("abc");

  String str2 = "abc";

  System.out.println(str1==str2);  //false 創建了兩個引用。創建了兩個對象。兩個引用分別指向不同的兩個對象。   String str1 = "abc";   String str2 = new String("abc");   System.out.println(str1==str2);  //false 創建了兩個引用。創建了兩個對象。兩個引用分別指向不同的兩個對象。 以上兩段代碼說明,只要是用new()來新建對象的,都會在堆中創建,而且其字符串是單獨存值的,即使與棧中的數據相同,也不會與棧中的數據共享。

5. 數據類型包裝類的值不可修改。不僅僅是String類的值不可修改,所有的數據類型包裝類都不能更改其內部的值。

6. 結論與建議:

  (1) 我們在使用諸如String str = "abc";的格式定義類時,總是想當然地認爲,我們創建了String類的對象str。擔心陷阱!對象可能並沒有被創建!唯一可以肯定的是,指向 String類的引用被創建了。至於這個引用到底是否指向了一個新的對象,必須根據上下文來考慮,除非你通過new()方法來顯要地創建一個新的對象。因 此,更爲準確的說法是,我們創建了一個指向String類的對象的引用變量str,這個對象引用變量指向了某個值爲"abc"的String類。清醒地認 識到這一點對排除程序中難以發現的bug是很有幫助的。

(2)使用String str = "abc";的方式,可以在一定程度上提高程序的運行速度,因爲JVM會自動根據棧中數據的實際情況來決定是否有必要創建新對象。而對於String str = new String("abc");的代碼,則一概在堆中創建新對象,而不管其字符串值是否相等,是否有必要創建新對象,從而加重了程序的負擔。這個思想應該是 享元模式的思想,但JDK的內部在這裏實現是否應用了這個模式,不得而知。

(3)當比較包裝類裏面的數值是否相等時,用equals()方法;當測試兩個包裝類的引用是否指向同一個對象時,用==。

(4)由於String類的immutable性質,當String變量需要經常變換其值時,應該考慮使用StringBuffer類,以提高程序效率 


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章