java虛擬機的工作原理

什麼是Java虛擬機


作爲一個Java程序員,我們每天都在寫Java代碼,我們寫的代碼都是在一個叫做Java虛擬機的東西上執行的。但是如果要問什麼是虛擬機,恐怕很多人就會模棱兩可了。在本文中,我會寫下我對虛擬機的理解。因爲能力所限,可能有些地方描述的不夠欠當。如果你有不同的理解,歡迎交流。

我們都知道Java程序必須在虛擬機上運行。那麼虛擬機到底是什麼呢?先看網上搜索到的比較靠譜的解釋:

虛擬機是一種抽象化的計算機,通過在實際的計算機上仿真模擬各種計算機功能來實現的。Java虛擬機有自己完善的硬體架構,如處理器堆棧寄存器等,還具有相應的指令系統。JVM屏蔽了與具體操作系統平臺相關的信息,使得Java程序只需生成在Java虛擬機上運行的目標代碼(字節碼),就可以在多種平臺上不加修改地運行。

這種解釋應該算是正確的,但是隻描述了虛擬機的外部行爲和功能,並沒有針對內部原理做出說明。一般情況下我們不需要知道虛擬機的運行原理,只要專注寫java代碼就可以了,這也正是虛擬機之所以存在的原因--屏蔽底層操作系統平臺的不同並且減少基於原生語言開發的複雜性,使java這門語言能夠跨各種平臺(只要虛擬機廠商在特定平臺上實現了虛擬機),並且簡單易用。這些都是虛擬機的外部特性,但是從這些信息來解釋虛擬機,未免太籠統了,無法讓我們知道內部原理。

從進程的角度解釋JVM


讓我們嘗試從操作系統的層面來理解虛擬機。我們知道,虛擬機是運行在操作系統之中的,那麼什麼東西才能在操作系統中運行呢?當然是進程,因爲進程是操作系統中的執行單位。可以這樣理解,當它在運行的時候,它就是一個操作系統中的進程實例,當它沒有在運行時(作爲可執行文件存放於文件系統中),可以把它叫做程序。


對命令行比較熟悉的同學,都知道其實一個命令對應一個可執行的二進制文件,當敲下這個命令並且回車後,就會創建一個進程,加載對應的可執行文件到進程的地址空間中,並且執行其中的指令。下面對比C語言和Java語言的HelloWorld程序來說明問題。


首先編寫C語言版的HelloWorld程序。

#include <stdio.h>  
#include <stdlib.h>  
  
int main(void) {  
    printf("hello world\n");  
    return 0;  
}  
編譯C語言版的HelloWorld程序:

gcc HelloWorld.c -o HelloWorld 

gcc編譯器編譯後的文件直接就是可被操作系統識別的二進制可執行文件,當我們在命令行中敲下 ./HelloWorld這條命令的時候, 直接創建一個進程, 並且將可執行文件加載到進程的地址空間中, 執行文件中的指令。


作爲對比, 我們看一下Java版HelloWord程序的編譯和執行形式。


首先編寫源文件HelloWord.java :

zhangjg@linux:/deve/workspace/HelloJava/src$ javac HelloWorld.java   
zhangjg@linux:/deve/workspace/HelloJava/src$ ls  
HelloWorld.class  HelloWorld.java  
運行Java版的HelloWorld程序:
zhangjg@linux:/deve/workspace/HelloJava/src$ java -classpath . HelloWorld   
HelloWorld 

從上面的過程可以看到, 我們在運行Java版的HelloWorld程序的時候, 敲入的命令並不是 ./HelloWorld.class 。 因爲class文件並不是可以直接被操作系統識別的二進制可執行文件 。 我們敲入的是java這個命令。 這個命令說明, 我們首先啓動的是一個叫做java的程序, 這個java程序在運行起來之後就是一個JVM進程實例。 


上面的命令執行流程是這樣的:

java命令首先啓動虛擬機進程,虛擬機進程成功啓動後,讀取參數HelloWorld”,把他作爲初始類加載到內存,對這個類進行初始化和動態鏈接(關於類的初始化和動態鏈接會在後面的博客中介紹),然後從這個類的main方法開始執行。也就是說我們的.class文件不是直接被系統加載後直接在cpu上執行的,而是被一個叫做虛擬機的進程託管的。首先必須虛擬機進程啓動就緒,然後由虛擬機中的類加載器加載必要的class文件,包括jdk中的基礎類(如StringObject等),然後由虛擬機進程解釋class字節碼指令,把這些字節碼指令翻譯成本機cpu能夠識別的指令,才能在cpu上運行。


從這個層面上來看,在執行一個所謂的java程序的時候,真真正正在執行的是一個叫做Java虛擬機的進程,而不是我們寫的一個個的class文件。這個叫做虛擬機的進程處理一些底層的操作,比如內存的分配和釋放等等。我們編寫的class文件只是虛擬機進程執行時需要的原料。這些原料在運行時被加載到虛擬機中,被虛擬機解釋執行,以控制虛擬機實現我們java代碼中所定義的一些相對高層的操作,比如創建一個文件等,可以將class文件中的信息看做對虛擬機的控制信息,也就是一種虛擬指令。


編程語言也有自己的原理, 學習一門語言, 主要是把它的原理搞明白。 看似一個簡單的HelloWorld程序, 也有很多深入的內容值得剖析。


JVM體系結構簡介


爲了展示虛擬機進程和class文件的關係,特意畫了下面一張圖:


根據上圖表達的內容,我們編譯之後的class文件是作爲Java虛擬機的原料被輸入到Java虛擬機的內部的,那麼具體由誰來做這一部分工作呢?其實在Java虛擬機內部,有一個叫做類加載器的子系統,這個子系統用來在運行時根據需要加載類。注意上面一句話中的根據需要四個字。在Java虛擬機執行過程中,只有他需要一個類的時候,纔會調用類加載器來加載這個類,並不會在開始運行時加載所有的類。就像一個人,只有餓的時候纔去吃飯,而不是一次把一年的飯都吃到肚子裏。一般來說,虛擬機加載類的時機,在第一次使用一個新的類的時候。本專欄後面的文章會具體討論Java中的類加載器。


由虛擬機加載的類,被加載到Java虛擬機內存中之後,虛擬機會讀取並執行它裏面存在的字節碼指令。虛擬機中執行字節碼指令的部分叫做執行引擎。就像一個人,不是把飯吃下去就完事了,還要進行消化,執行引擎就相當於人的腸胃系統。在執行的過程中還會把各個class文件動態的連接起來。關於執行引擎的具體行爲和動態鏈接相關的內容也會在本專欄後續的文章中進行討論。


我們知道,Java虛擬機會進行自動內存管理。具體說來就是自動釋放沒有用的對象,而不需要程序員編寫代碼來釋放分配的內存。這部分工作由垃圾收集子系統負責。


從上面的論述可以知道, 一個Java虛擬機實例在運行過程中有三個子系統來保障它的正常運行,分別是類加載器子系統, 執行引擎子系統和垃圾收集子系統。 如下圖所示:


虛擬機的運行,必須加載class文件,並且執行class文件中的字節碼指令。它做這麼多事情,必須需要自己的空間。就像人吃下去的東西首先要放在胃中。虛擬機也需要空間來存放個中數據。首先,加載的字節碼,需要一個單獨的內存空間來存放;一個線程的執行,也需要內存空間來維護方法的調用關係,存放方法中的數據和中間計算結果;在執行的過程中,無法避免的要創建對象,創建的對象需要一個專門的內存空間來存放。關於虛擬機運行時數據區的內容,也會出現在本專欄後續的文章中。虛擬機的運行時內存區大概可以分成下圖所示的幾個部分。(這裏只是大概劃分, 並沒有劃分的很精細)


總結


寫到這裏,基本上關於我對java虛擬機的理解就寫完了。這篇文章的主題雖然是深入理解Java虛擬機,但是你可能感覺一點也不深入,也只是泛泛而談。我也有這樣的感覺。限於自己水平有限,也只能這樣了,要是想深入理解java虛擬機,強烈建議讀一下三本書:


《深入Java虛擬機》

《深入理解Java虛擬機JVM高級特性與最佳實踐》

Java虛擬機規範》


其實我也讀過這幾本書,但是它們對虛擬機的解釋也是基於一個外部模型,而沒有深入剖析虛擬機內部的實現原理。虛擬機是一個大而複雜的東西,實現虛擬機的人都是大牛級別的,如果不是參與過虛擬機的實現,應該很少有人能把它參透。本專欄後面的一些文章也參考了這三本書, 雖然講解Java語法的書不計其數, 但是深入講解虛擬機的書, 目前爲止我就見過這三本,並且網上的資料也不是很多。


最後做一個總結:

虛擬機並不神祕,在操作系統的角度看來,它只是一個普通進程。

這個叫做虛擬機的進程比較特殊,它能夠加載我們編寫的class文件。如果把JVM比作一個人,那麼class文件就是我們吃的食物。

加載class文件的是一個叫做類加載器的子系統。就好比我們的嘴巴,把食物吃到肚子裏。

虛擬機中的執行引擎用來執行class文件中的字節碼指令。就好比我們的腸胃,對吃進去的食物進行消化。

虛擬機在執行過程中,要分配內存創建對象。當這些對象過時無用了,必須要自動清理這些無用的對象。清理對象回收內存的任務由垃圾收集器負責。就好比人吃進去的食物,在消化之後,必須把廢物排出體外,騰出空間可以在下次餓的時候吃飯並消化食物。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章