JVM 那點事

因爲團隊的終端開發嘗試轉移到android 平臺,所以一幫以前的C/C++ 開發人員開始學習Java,一個比較大的區別是Java不是native的,有VM。剛好看到一篇文章,講了這個事,大家正好了解一下,第4部分問答很不錯:

1 JVM簡介

JVM是我們Javaer的最基本功底了,剛開始學Java的時候,一般都是從“Hello World”開始的,然後會寫個複雜點class,然後再找一些開源框架,比如Spring,Hibernate等等,再然後就開發企業級的應用,比如網站、企業內部應用、實時交易系統等等,直到某一天突然發現做的系統咋就這麼慢呢,而且時不時還來個內存溢出什麼的,今天是交易系統報了StackOverflowError,明天是網站系統報了個OutOfMemoryError,這種錯誤又很難重現,只有分析Javacore和dump文件,運氣好點還能分析出個結果,運行遭的點,就直接去廟裏燒香吧!每天接客戶的電話都是戰戰兢兢的,生怕再出什麼幺蛾子了。我想Java做的久一點的都有這樣的經歷,那這些問題的最終根結是在哪呢?—— JVM。

JVM全稱是Java Virtual Machine,Java虛擬機,也就是在計算機上再虛擬一個計算機,這和我們使用 VMWare不一樣,那個虛擬的東西你是可以看到的,這個JVM你是看不到的,它存在內存中。我們知道計算機的基本構成是:運算器、控制器、存儲器、輸入和輸出設備,那這個JVM也是有這成套的元素,運算器是當然是交給硬件CPU還處理了,只是爲了適應“一次編譯,隨處運行”的情況,需要做一個翻譯動作,於是就用了JVM自己的命令集,這與彙編的命令集有點類似,每一種彙編命令集針對一個系列的CPU,比如8086系列的彙編也是可以用在8088上的,但是就不能跑在8051上,而JVM的命令集則是可以到處運行的,因爲JVM做了翻譯,根據不同的CPU,翻譯成不同的機器語言。

JVM中我們最需要深入理解的就是它的存儲部分,存儲?硬盤?NO,NO, JVM是一個內存中的虛擬機,那它的存儲就是內存了,我們寫的所有類、常量、變量、方法都在內存中,這決定着我們程序運行的是否健壯、是否高效,接下來的部分就是重點介紹之。

2 JVM的組成部分

我們先把JVM這個虛擬機畫出來,如下圖所示:

從這個圖中可以看到,JVM是運行在操作系統之上的,它與硬件沒有直接的交互。我們再來看下JVM有哪些組成部分,如下圖所示:


該圖參考了網上廣爲流傳的JVM構成圖,大家看這個圖,整個JVM分爲四部分:

q Class Loader 類加載器

類加載器的作用是加載類文件到內存,比如編寫一個HelloWord.java程序,然後通過javac編譯成class文件,那怎麼才能加載到內存中被執行呢?Class Loader承擔的就是這個責任,那不可能隨便建立一個.class文件就能被加載的,Class Loader加載的class文件是有格式要求,在《JVM Specification》中式這樣定義Class文件的結構:

需要詳細瞭解的話,可以仔細閱讀《JVM Specification》的第四章“The class File Format”,這裏不再詳細說明。

友情提示:Class Loader只管加載,只要符合文件結構就加載,至於說能不能運行,則不是它負責的,那是由Execution Engine負責的。

q Execution Engine 執行引擎

執行引擎也叫做解釋器(Interpreter),負責解釋命令,提交操作系統執行。

q Native Interface本地接口

本地接口的作用是融合不同的編程語言爲Java所用,它的初衷是融合C/C++程序,Java誕生的時候是C/C++橫行的時候,要想立足,必須有一個聰明的、睿智的調用C/C++程序,於是就在內存中專門開闢了一塊區域處理標記爲native的代碼,它的具體做法是Native Method Stack中登記native方法,在Execution Engine執行時加載native libraies。目前該方法使用的是越來越少了,除非是與硬件有關的應用,比如通過Java程序驅動打印機,或者Java系統管理生產設備,在企業級應用中已經比較少見,因爲現在的異構領域間的通信很發達,比如可以使用Socket通信,也可以使用Web Service等等,不多做介紹。

q Runtime data area運行數據區

運行數據區是整個JVM的重點。我們所有寫的程序都被加載到這裏,之後纔開始運行,Java生態系統如此的繁榮,得益於該區域的優良自治,下一章節詳細介紹之。

整個JVM框架由加載器加載文件,然後執行器在內存中處理數據,需要與異構系統交互是可以通過本地接口進行,瞧,一個完整的系統誕生了!

3 JVM的內存管理

所有的數據和程序都是在運行數據區存放,它包括以下幾部分:

q Stack 棧

棧也叫棧內存,是Java程序的運行區,是在線程創建時創建,它的生命期是跟隨線程的生命期,線程結束棧內存也就釋放,對於棧來說不存在垃圾回收問題,只要線程一結束,該棧就Over。問題出來了:棧中存的是那些數據呢?又什麼是格式呢?

棧中的數據都是以棧幀(Stack Frame)的格式存在,棧幀是一個內存區塊,是一個數據集,是一個有關方法(Method)和運行期數據的數據集,當一個方法A被調用時就產生了一個棧幀F1,並被壓入到棧中,A方法又調用了B方法,於是產生棧幀F2也被壓入棧,執行完畢後,先彈出F2棧幀,再彈出F1棧幀,遵循“先進後出”原則。

那棧幀中到底存在着什麼數據呢?棧幀中主要保存3類數據:本地變量(Local Variables),包括輸入參數和輸出參數以及方法內的變量;棧操作(Operand Stack),記錄出棧、入棧的操作;棧幀數據(Frame Data),包括類文件、方法等等。光說比較枯燥,我們畫個圖來理解一下Java棧,如下圖所示:


圖示在一個棧中有兩個棧幀,棧幀2是最先被調用的方法,先入棧,然後方法2又調用了方法1,棧幀1處於棧頂的位置,棧幀2處於棧底,執行完畢後,依次彈出棧幀1和棧幀2,線程結束,棧釋放。

q Heap 堆內存

一個JVM實例只存在一個堆類存,堆內存的大小是可以調節的。類加載器讀取了類文件後,需要把類、方法、常變量放到堆內存中,以方便執行器執行,堆內存分爲三部分:

Permanent Space 永久存儲區

永久存儲區是一個常駐內存區域,用於存放JDK自身所攜帶的Class,Interface的元數據,也就是說它存儲的是運行環境必須的類信息,被裝載進此區域的數據是不會被垃圾回收器回收掉的,關閉JVM纔會釋放此區域所佔用的內存。

Young Generation Space 新生區

新生區是類的誕生、成長、消亡的區域,一個類在這裏產生,應用,最後被垃圾回收器收集,結束生命。新生區又分爲兩部分:伊甸區(Eden space)和倖存者區(Survivor pace),所有的類都是在伊甸區被new出來的。倖存區有兩個: 0區(Survivor 0 space)和1區(Survivor 1 space)。當伊甸園的空間用完時,程序又需要創建對象,JVM的垃圾回收器將對伊甸園區進行垃圾回收,將伊甸園區中的不再被其他對象所引用的對象進行銷燬。然後將伊甸園中的剩餘對象移動到倖存0區。若倖存0區也滿了,再對該區進行垃圾回收,然後移動到1區。那如果1區也滿了呢?再移動到養老區。

Tenure generation space養老區

養老區用於保存從新生區篩選出來的JAVA對象,一般池對象都在這個區域活躍。 三個區的示意圖如下:


q Method Area 方法區

方法區是被所有線程共享,該區域保存所有字段和方法字節碼,以及一些特殊方法如構造函數,接口代碼也在此定義。

q PC Register 程序計數器

每個線程都有一個程序計數器,就是一個指針,指向方法區中的方法字節碼,由執行引擎讀取下一條指令。

q Native Method Stack 本地方法棧

 

4 JVM相關問題

問:堆和棧有什麼區別

答:堆是存放對象的,但是對象內的臨時變量是存在棧內存中,如例子中的methodVar是在運行期存放到棧中的。

棧是跟隨線程的,有線程就有棧,堆是跟隨JVM的,有JVM就有堆內存。

問:堆內存中到底存在着什麼東西?

答:對象,包括對象變量以及對象方法。

問:類變量和實例變量有什麼區別?

答:靜態變量是類變量,非靜態變量是實例變量,直白的說,有static修飾的變量是靜態變量,沒有static修飾的變量是實例變量。靜態變量存在方法區中,實例變量存在堆內存中。

問:我聽說類變量是在JVM啓動時就初始化好的,和你這說的不同呀!

答:那你是道聽途說,信我的,沒錯。

問:Java的方法(函數)到底是傳值還是傳址?

答:都不是,是以傳值的方式傳遞地址,具體的說原生數據類型傳遞的值,引用類型傳遞的地址。對於原始數據類型,JVM的處理方法是從Method Area或Heap中拷貝到Stack,然後運行frame中的方法,運行完畢後再把變量指拷貝回去。

問:爲什麼會產生OutOfMemory產生?

答:一句話:Heap內存中沒有足夠的可用內存了。這句話要好好理解,不是說Heap沒有內存了,是說新申請內存的對象大於Heap空閒內存,比如現在Heap還空閒1M,但是新申請的內存需要1.1M,於是就會報OutOfMemory了,可能以後的對象申請的內存都只要0.9M,於是就只出現一次OutOfMemory,GC也正常了,看起來像偶發事件,就是這麼回事。 但如果此時GC沒有回收就會產生掛起情況,系統不響應了。

問:我產生的對象不多呀,爲什麼還會產生OutOfMemory

答:你繼承層次忒多了,Heap中 產生的對象是先產生 父類,然後才產生子類,明白不?

問:OutOfMemory錯誤分幾種?

答:分兩種,分別是“OutOfMemoryError:java heap size”和”OutOfMemoryError: PermGen space”,兩種都是內存溢出,heap size是說申請不到新的內存了,這個很常見,檢查應用或調整堆內存大小。

“PermGen space”是因爲永久存儲區滿了,這個也很常見,一般在熱發佈的環境中出現,是因爲每次發佈應用系統都不重啓,久而久之永久存儲區中的死對象太多導致新對象無法申請內存,一般重新啓動一下即可。

問:爲什麼會產生StackOverflowError

答:因爲一個線程把Stack內存全部耗盡了,一般是遞歸函數造成的。

問:一個機器上可以看多個JVM嗎?JVM之間可以互訪嗎?

答:可以多個JVM,只要機器承受得了。JVM之間是不可以互訪,你不能在A-JVM中訪問B-JVM的Heap內存,這是不可能的。在以前老版本的JVM中,會出現A-JVM Crack後影響到B-JVM,現在版本非常少見。

問:爲什麼Java要採用垃圾回收機制,而不採用C/C++的顯式內存管理?

答:爲了簡單,內存管理不是每個程序員都能折騰好的。

問:爲什麼你沒有詳細介紹垃圾回收機制?

答:垃圾回收機制每個JVM都不同,JVM Specification只是定義了要自動釋放內存,也就是說它只定義了垃圾回收的抽象方法,具體怎麼實現各個廠商都不同,算法各異,這東西實在沒必要深入。

問:JVM中到底哪些區域是共享的?哪些是私有的?

答:Heap和Method Area是共享的,其他都是私有的,

問:什麼是JIT,你怎麼沒說?

答:JIT是指Just In Time,有的文檔把JIT作爲JVM的一個部件來介紹,有的是作爲執行引擎的一部分來介紹,這都能理解。Java剛誕生的時候是一個解釋性語言,別噓,即使編譯成了字節碼(byte code)也是針對JVM的,它需要再次翻譯成原生代碼(native code)才能被機器執行,於是效率的擔憂就提出來了。Sun爲了解決該問題提出了一套新的機制,好,你想編譯成原生代碼,沒問題,我在JVM上提供一個工具,把字節碼編譯成原生碼,下次你來訪問的時候直接訪問原生碼就成了,於是JIT就誕生了,就這麼回事。

問:JVM還有哪些部分是你沒有提到的?

答:JVM是一個異常複雜的東西,寫一本磚頭書都不爲過,還有幾個要說明的:

常量池(constant pool):按照順序存放程序中的常量,並且進行索引編號的區域。比如int i =100,這個100就放在常量池中。

安全管理器(Security Manager):提供Java運行期的安全控制,防止惡意攻擊,比如指定讀取文件,寫入文件權限,網絡訪問,創建進程等等,Class Loader在Security Manager認證通過後才能加載class文件的。

方法索引表(Methods table),記錄的是每個method的地址信息,Stack和Heap中的地址指針其實是指向Methods table地址。

問:爲什麼不建議在程序中顯式的生命System.gc()

答:因爲顯式聲明是做堆內存全掃描,也就是Full GC,是需要停止所有的活動的(Stop The World Collection),你的應用能承受這個嗎?

問:JVM有哪些調整參數?

答:非常多,自己去找,堆內存、棧內存的大小都可以定義,甚至是堆內存的三個部分、新生代的各個比例都能調整。

轉自這裏:慢慢琢磨JVM——恭喜JavaEye重新開張 - Java綜合 - Java - JavaEye論壇

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章