jvm性能調優 之 基礎知識

數據類型

    Java虛擬機中,數據類型可以分爲兩類:基本類型引用類型 。基本類型的變量保存原始值,即:他代表的值就是數值本身;而引用類型的變量保存引用值。“引用值”代表了某個對象的引用,而不是對象本身,對象本身存放在這個引用值所表示的地址的位置。

基本類型包括:byte,short,int,long,char,float,double,Boolean,returnAddress

引用類型包括:類類型接口類型數組

堆與棧

    堆和棧是程序運行的關鍵,很有必要把他們的關係說清楚。



棧是運行時的單位,而堆是存儲的單位

    棧解決程序的運行問題,即程序如何執行,或者說如何處理數據;堆解決的是數據存儲的問題,即數據怎麼放、放在哪兒。

    在Java中一個線程就會相應有一個線程棧與之對應,這點很容易理解,因爲不同的線程執行邏輯有所不同,因此需要一個獨立的線程棧。而堆則是所有線程共享 的。棧因爲是運行單位,因此裏面存儲的信息都是跟當前線程(或程序)相關信息的。包括局部變量、程序運行狀態、方法返回值等等;而堆只負責存儲對象信息。

    爲什麼要把堆和棧區分出來呢?棧中不是也可以存儲數據嗎

    第一,從軟件設計的角度看,棧代表了處理邏輯 ,而堆代表了數據 。這樣分開,使得處理邏輯更爲清晰。分而治之的思想 。這種隔離、模塊化的思想在軟件設計的方方面面都有體現。

    第二,堆與棧的分離,使得堆中的內容可以被多個棧共享 (也可以理解爲多個線程訪問同一個對象)。這種共享的收益是很多的。一方面這種共享提供了一種有效的數據交互方式(如:共享內存),另一方面,堆中的共享常量和緩存可以被所有棧訪問,節省了空間。

    第三,棧因爲運行時的需要,比如保存系統運行的上下文,需要進行地址段的劃分。由於棧只能向上增長,因此就會限制住棧存儲內容的能力。而堆不同,堆中的對象是可以根據需要動態增長的,因此棧和堆的拆分,使得動態增長成爲可能 ,相應棧中只需記錄堆中的一個地址即可。

    第四,面向對象就是堆和棧的完美結合 。其實, 面向對象方式的程序與以前結構化的程序在執行上沒有任何區別。但是,面向對象的引入,使得對待問題的思考方式發生了改變,而更接近於自然方式的思考。當我 們把對象拆開,你會發現,對象的屬性其實就是數據,存放在堆中;而對象的行爲(方法),就是運行邏輯,放在棧中。我們在編寫對象的時候,其實即編寫了數據 結構,也編寫的處理數據的邏輯。不得不承認,面向對象的設計,確實很美。

    在Java中,Main函數就是棧的起始點,也是程序的起始點

    程序要運行總是有一個起點的。同C語言一樣,java中的Main就是那個起點。無論什麼java程序,找到main就找到了程序執行的入口:)

    堆中存什麼?棧中存什麼

    堆中存的是對象 。棧中存的是基本數據類型堆中對象的引用 。一個對象的大小是不可估計的,或者說是可以動態變化的,但是在棧中,一個對象只對應了一個4btye的引用(堆棧分離的好處:))。

    爲什麼不把基本類型放堆中呢?因爲其佔用的空間一般是1~8個字節——需要空間比較少,而且因爲是基本類型,所以不會出現動態增長的情況——長度固定,因 此棧中存儲就夠了,如果把他存在堆中是沒有什麼意義的(還會浪費空間,後面說明)。可以這麼說,基本類型和對象的引用都是存放在棧中,而且都是幾個字節的 一個數,因此在程序運行時,他們的處理方式是統一的。但是基本類型、對象引用和對象本身就有所區別了,因爲一個是棧中的數據一個是堆中的數據。最常見的一 個問題就是,Java中參數傳遞時的問題。

    Java中的參數傳遞時傳值呢?還是傳引用

    要說明這個問題,先要明確兩點:

         1. 不要試圖與C進行類比,Java中沒有指針的概念

         2. 程序運行永遠都是在棧中進行的,因而參數傳遞時,只存在傳遞基本類型和對象引用的問題 。不會直接傳對象本身。

    明確以上兩點後。Java在方法調用傳遞參數時,因爲沒有指針,所以它都是進行傳值調用 (這點可以參考C的傳值調用)。因此,很多書裏面都說Java是進行傳值調用,這點沒有問題,而且也簡化的C中複雜性。

    但是傳引用的錯覺是如何造成的呢? 在運行棧中,基本類型和引用的處理是一樣的,都是傳值 , 所以,如果是傳引用的方法調用,也同時可以理解爲“傳引用值”的傳值調用,即引用的處理跟基本類型是完全一樣的。但是當進入被調用方法時,被傳遞的這個引 用的值,被程序解釋(或者查找)到堆中的對象,這個時候纔對應到真正的對象。如果此時進行修改,修改的是引用對應的對象,而不是引用本身,即:修改的是堆 中的數據。所以這個修改是可以保持的了。

    對象,從某種意義上說,是由基本類型組成的。可以把一個對象看作爲一棵樹,對象的屬性如果還是對象,則還是一顆樹(即非葉子節點),基本類型則爲樹的葉子節點 。程序參數傳遞時,被傳遞的值本身都是不能進行修改的,但是,如果這個值是一個非葉子節點(即一個對象引用),則可以修改這個節點下面的所有內容。

    堆和棧中,棧是程序運行最根本的東西。程序運行可以沒有堆,但是不能沒有棧。而堆是爲棧進行數據存儲服務,說白了堆就是一塊共享的內存。不過,正是因爲堆和棧的分離的思想,才使得Java的垃圾回收成爲可能。

     Java中,棧的大小通過-Xss來設置,當棧中存儲數據比較多時,需要適當調大這個值,否則會出現java.lang.StackOverflowError異常。常見的出現這個異常的是無法返回的遞歸,因爲此時棧中保存的信息都是方法返回的記錄點。

Java對象的大小

    基本數據的類型的大小是固定的,這裏就不多說了。對於非基本類型的Java對象,其大小就值得商榷。

    在Java中,一個空Object對象的大小是8byte ,這個大小隻是保存堆中一個沒有任何屬性的對象的大小。看下面語句:

Java代碼  收藏代碼
  1. Object ob = new Object(); 

這樣在程序中完成了一個Java對象的生命,但是它所佔的空間爲:4byte+8byte 。4byte是上面部分所說的Java棧中保存引用的所需要的空間。而那8byte則是Java堆中對象的信息。因爲所有的Java非基本類型的對象都需要默認繼承Object對象,因此不論什麼樣的Java對象,其大小都必須是大於8byte。

   有了Object對象的大小,我們就可以計算其他對象的大小了。

Java代碼  收藏代碼
  1. Class NewObject { 
  2.  
  3.     int count; 
  4.  
  5.     boolean flag; 
  6.  
  7.     Object ob; 
  8.  
  9.  
  10.     其大小爲:空對象大小(8byte)+int大小(4byte)+Boolean大小(1byte)+空Object引用的大小 (4byte)=17byte。但是因爲Java在對對象內存分配時都是以8的整數倍來分,因此大於17byte的最接近8的整數倍的是24,因此此對象的大小爲24byte。 

   這裏需要注意一下基本類型的包裝類型的大小 。因爲這種包裝類型已經成爲對象了,因此需要把他們作爲對象來看待。包裝類型的大小至少是12byte(聲明一個空Object至少需要的空間),而且12byte沒有包含任何有效信息,同時,因爲Java對象大小是8的整數倍,因此一個基本類型包裝類的大小至少是16byte 。這個內存佔用是很恐怖的,它是使用基本類型的N倍(N>2),有些類型的內存佔用更是誇張(隨便想下就知道了)。因此,可能的話應儘量少使用包裝類。在JDK5.0以後,因爲加入了自動類型裝換,因此,Java虛擬機會在存儲方面進行相應的優化。

引用類型

    對象引用類型分爲強引用、軟引用、弱引用和虛引用

強引用: 就是我們一般聲明對象是時虛擬機生成的引用,強引用環境下,垃圾回收時需要嚴格判斷當前對象是否被強引用,如果被強引用,則不會被垃圾回收

軟引用: 軟引用一 般被做爲緩存來使用。與強引用的區別是,軟引用在垃圾回收時,虛擬機會根據當前系統的剩餘內存來決定是否對軟引用進行回收。如果剩餘內存比較緊張,則虛擬 機會回收軟引用所引用的空間;如果剩餘內存相對富裕,則不會進行回收。換句話說,虛擬機在發生OutOfMemory時,肯定是沒有軟引用存在的。

弱引用: 弱引用與軟引用類似,都是作爲緩存來使用。但與軟引用不同,弱引用在進行垃圾回收時,是一定會被回收掉的,因此其生命週期只存在於一個垃圾回收週期內。

    強引用不用說,我們系統一般在使用時都是用的強引用。而“軟引用”和“弱引用”比較少見。他們一般被作爲緩存使用,而且一般是在內存大小比較受限的情況下 做爲緩存。因爲如果內存足夠大的話,可以直接使用強引用作爲緩存即可,同時可控性更高。因而,他們常見的是被使用在桌面應用系統的緩存。

JVM調優總結(三)-基本垃圾回收算法

可以從不同的的角度去劃分垃圾回收算法:

按照基本回收策略分

引用計數(Reference Counting):

比較古老的回收算法。原理是此對象有一個引用,即增加一個計數,刪除一個引用則減少一個計數。垃圾回收時,只用收集計數爲0的對象。此算法最致命的是無法處理循環引用的問題。

標記-清除(Mark-Sweep):




複製(Copying):



此算法結合了“標記-清除”和“複製”兩個算法的優點。也是分兩階段,第一階段從根節點開始標記所有被引用對象,第二階段遍歷整個堆,把清除未標記 對象並且把存活對象“壓縮”到堆的其中一塊,按順序排放。此算法避免了“標記-清除”的碎片問題,同時也避免了“複製”算法的空間問題。

按分區對待的方式分

增量收集(Incremental Collecting): 實時垃圾回收算法,即:在應用進行的同時進行垃圾回收。不知道什麼原因JDK5.0中的收集器沒有使用這種算法的。

分代收集(Generational Collecting): 基於對對象生命週期分析後得出的垃圾回收算法。把對象分爲年青代、年老代、持久代,對不同生命週期的對象使用不同的算法(上述方式中的一個)進行回收。現在的垃圾回收器(從J2SE1.2開始)都是使用此算法的。

按系統線程分

串行收集: 串行收集使用單線程處理所有垃圾回收工作,因爲無需多線程交互,實現容易,而且效率比較高。但是,其侷限性也比較明顯,即無法使用多處理器的優勢,所以此收集適合單處理器機器。當然,此收集器也可以用在小數據量(100M左右)情況下的多處理器機器上。

並行收集: 並行收集使用多線程處理垃圾回收工作,因而速度快,效率高。而且理論上CPU數目越多,越能體現出並行收集器的優勢。

併發收集: 相對於串行收集和並行收集而言,前面兩個在進行垃圾回收工作時,需要暫停整個運行環境,而只有垃圾回收程序在運行,因此,系統在垃圾回收時會有明顯的暫停,而且暫停時間會因爲堆越大而越長。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章