『互聯網架構』軟件架構-JVM(上)

說到JVM,很多工作多年的老鐵,可能就有點發憷了,因爲搬磚多年,一直使用java這個工具,對於JVM沒有了解過,有句話面試造航母,上班擰螺絲,要啥自行車啊,知道如何搬磚就可以了,爲啥要懂這麼多,如果你有很強的商業頭腦,不需要了解太多深入的東西,只要完成業務功能就可以了,如果你口才也不行,只有一個編程的大腦,老鐵沉下心咱們一起了解下,你平常擰螺絲的扳手的結構把,這個真心有用。因爲它可以讓你走的更遠,掙的更多!

『互聯網架構』軟件架構-JVM(上)

###JVM

JVM一些概念

  • 什麼是JVM

JVM是Java Virtual Machine(Java虛擬機)的縮寫,JVM是一種用於計算設備的規範,它是一個虛構出來的計算機,是通過在實際的計算機上仿真模擬各種計算機功能來實現的。Java虛擬機包括一套字節碼指令集、一組寄存器、一個棧、一個垃圾回收堆和一個存儲方法域。 JVM屏蔽了與具體操作系統平臺相關的信息,使Java程序只需生成在Java虛擬機上運行的目標代碼(字節碼),就可以在多種平臺上不加修改地運行。JVM在執行字節碼時,實際上最終還是把字節碼解釋成具體平臺上的機器指令執行。

  • JVM和普通虛擬機
    1.JVM是Java Virtual Machine(Java虛擬機),執行java字節碼的環境,一個程序自己獨立的環境,必須要包含堆棧,寄存器,字節碼指令。Java、Android、Scala、Groovy等語言都是可以在JVM上運行的,它們都遵照JVM的指令集的,也就是class規範。
    2.VMWare,VisualBox它是一個完完整整可以提供一個虛擬主機的PC,這種虛擬機上邊必須安裝操作系統的,它是模擬物理主機的CPU的指令集。

  • JVM、JDK、JRE的關係

    JVM是基本的單位,JRE是java的運行是環境,JDK是開發工具集
    JVM 小於 JRE 小於 JDK

1.JRE(JavaRuntimeEnvironment,Java運行環境),也就是Java平臺。所有的Java 程序都要在JRE下才能運行。普通用戶只需要運行已開發好的java程序,安裝JRE即可。

2.JDK(Java Development Kit)是程序開發者用來來編譯、調試java程序用的開發工具包。JDK的工具也是Java程序,也需要JRE才能運行。爲了保持JDK的獨立性和完整性,在JDK的安裝過程中,JRE也是 安裝的一部分。所以,在JDK的安裝目錄下有一個名爲jre的目錄,用於存放JRE文件。

3.JVM(JavaVirtualMachine,Java虛擬機)是JRE的一部分。它是一個虛構出來的計算機,是通過在實際的計算機上仿真模擬各種計算機功能來實現的。JVM有自己完善的硬件架構,如處理器、堆棧、寄存器等,還具有相應的指令系統。Java語言最重要的特點就是跨平臺運行。使用JVM就是爲了支持與操作系統無關,實現跨平臺。

  • JVM產品有哪些

    HotSpot,Jrockit,J9

  • 爲什麼出現JVM
    1.C,C++是基於os架構,CPU架構。64位的版本在32位無法運行的。性能非常高,編寫底層實現。
    2.JAVA可以一次編寫到處運行,移植性好。

JVM運行流程

1.java編譯成class文件,字節碼文件,不是純粹的二進制字節碼文件,在操作系統上是不可以直接運行的,而純粹的二進制文件是可以直接運行的。
2.JVM中有個執行引擎,當JVM編譯好後,轉換成對應到不同操作系統的指令。發送到操作系統上去。所有操作系統都可以識別自己的指令。
3.window上是dll程序,linux是.o的動態鏈接庫。
『互聯網架構』軟件架構-JVM(上)


JVM結構

1.類加載器
2.執行引擎
3.運行時數據區
4.本地接口


『互聯網架構』軟件架構-JVM(上)

  • ClassLoader類加載器

    JVM加載的是.class文件。其實,類的加載指的是將類的.class文件中的二進制數據讀入到內存中,將其放在運行時數據區的方法區內,然後在堆區創建一個java.lang.Class對象,用來封裝類在方法區內的數據結構。類的加載的最終產品是位於堆區中的Class對象,Class對象封裝了類在方法區內的數據結構,並且向Java程序員提供了訪問方法區內的數據結構的接口。
    同時,JVM規範允許類加載器在預料某個類將要被使用時就預先加載它,如果在預先加載的過程中遇到了.class文件缺失或存在錯誤,類加載器會在程序首次主動使用該類時會生成錯誤報告(LinkageError錯誤),如果這個類一直沒有被程序主動使用,那麼類加載器就不會報告錯誤。

  • 雙親委派模型

『互聯網架構』軟件架構-JVM(上)

  • 類加載過程

    1. 當一個類加載器接收到一個類加載的任務時,不會立即展開加載,而是將加載任務委託給它的父類加載器去執行,每一層的類都採用相同的方式,直至委託給最頂層的啓動類加載器爲止。如果父類加載器無法加載委託給它的類,便將類的加載任務退回給下一級類加載器去執行加載。
    2. 雙親委託模型的工作過程是:如果一個類加載器收到了類加載的請求,它首先不會自己去嘗試加載這個類,而是把這個請求委託給父類加載器去完成,每一個層次的類加載器都是如此,因此所有的加載請求最終都應該傳送到頂層的啓動類加載器中,只有當父類加載器反饋自己無法完成這個加載請求(它的搜索範圍中沒有找到所需要加載的類)時,子加載器纔會嘗試自己去加載。
    3. 使用雙親委託機制的好處是:能夠有效確保一個類的全局唯一性,當程序中出現多個限定名相同的類時,類加載器在執行加載時,始終只會加載其中的某一個類。
    4. 使用雙親委託模型來組織類加載器之間的關係,有一個顯而易見的好處就是Java類隨着它的類加載器一起具備了一種帶有優先級的層次關係。例如類java.lang.Object,它存放在rt.jar之中,無論哪一個類加載器要加載這個類,最終都是委託給處於模型最頂端的啓動類加載器進行加載,因此Object類在程序的各種加載器環境中都是同一個類。相反,如果沒有使用雙親委託模型,由各個類加載器自行去加載的話,如果用戶自己編寫了一個稱爲java.lang.Object的類,並放在程序的ClassPath中,那系統中將會出現多個不同的Object類,Java類型體系中最基礎的行爲也就無法保證,應用程序也將會變得一片混亂。如果自己去編寫一個與rt.jar類庫中已有類重名的Java類,將會發現可以正常編譯,但永遠無法被加載運行。
    5. 雙親委託模型對於保證Java程序的穩定運作很重要,但它的實現卻非常簡單,實現雙親委託的代碼都集中在java.lang.ClassLoader的loadClass()方法中,邏輯清晰易懂:先檢查是否已經被加載過,若沒有加載則調用父類加載器的loadClass()方法,若父加載器爲空則默認使用啓動類加載器作爲父加載器。如果父類加載器加載失敗,拋出ClassNotFoundException異常後,再調用自己的findClass方法進行加載。
  • 加載
    簡單的說,類加載階段就是由類加載器負責根據一個類的全限定名來讀取此類的二進制字節流到JVM內部,並存儲在運行時內存區的方法區,然後將其轉換爲一個與目標類型對應的java.lang.Class對象實例(Java虛擬機規範並沒有明確要求一定要存儲在堆區中,只是hotspot選擇將Class對戲那個存儲在方法區中),這個Class對象在日後就會作爲方法區中該類的各種數據的訪問入口。

  • 鏈接
    鏈接階段要做的是將加載到JVM中的二進制字節流的類數據信息合併到JVM的運行時狀態中,經由驗證、準備和解析三個階段。
    (1)驗證
    驗證類數據信息是否符合JVM規範,是否是一個有效的字節碼文件,驗證內容涵蓋了類數據信息的格式驗證、語義分析、操作驗證等。
    格式驗證:驗證是否符合class文件規範
    語義驗證:檢查一個被標記爲final的類型是否包含子類;檢查一個類中的final方法視頻被子類進行重寫;確保父類和子類之間沒有不兼容的一些方法聲明(比如方法簽名相同,但方法的返回值不同)
    操作驗證:在操作數棧中的數據必須進行正確的操作,對常量池中的各種符號引用執行驗證(通常在解析階段執行,檢查是否通過富豪引用中描述的全限定名定位到指定類型上,以及類成員信息的訪問修飾符是否允許訪問等)
    (2)準備
    爲類中的所有靜態變量分配內存空間,併爲其設置一個初始值(由於還沒有產生對象,實例變量不在此操作範圍內)
    被final修飾的靜態變量,會直接賦予原值;類字段的字段屬性表中存在ConstantValue屬性,則在準備階段,其值就是ConstantValue的值
    (3)解析
    將常量池中的符號引用轉爲直接引用(得到類或者字段、方法在內存中的指針或者偏移量,以便直接調用該方法),這個可以在初始化之後再執行。
    可以認爲是一些靜態綁定的會被解析,動態綁定則只會在運行是進行解析;靜態綁定包括一些final方法(不可以重寫),static方法(只會屬於當前類),構造器(不會被重寫)











  • 初始化
    將一個類中所有被static關鍵字標識的代碼統一執行一遍,如果執行的是靜態變量,那麼就會使用用戶指定的值覆蓋之前在準備階段設置的初始值;如果執行的是static代碼塊,那麼在初始化階段,JVM就會執行static代碼塊中定義的所有操作。
    所有類變量初始化語句和靜態代碼塊都會在編譯時被前端編譯器放在收集器裏頭,存放到一個特殊的方法中,這個方法就是<clinit>方法,即類/接口初始化方法。該方法的作用就是初始化一箇中的變量,使用用戶指定的值覆蓋之前在準備階段裏設定的初始值。任何invoke之類的字節碼都無法調用<clinit>方法,因爲該方法只能在類加載的過程中由JVM調用。
    如果父類還沒有被初始化,那麼優先對父類初始化,但在<clinit>方法內部不會顯示調用父類的<clinit>方法,由JVM負責保證一個類的<clinit>方法執行之前,它的父類<clinit>方法已經被執行。
    JVM必須確保一個類在初始化的過程中,如果是多線程需要同時初始化它,僅僅只能允許其中一個線程對其執行初始化操作,其餘線程必須等待,只有在活動線程執行完對類的初始化操作之後,纔會通知正在等待的其他線程。



JVM運行時數據區

JVM在執行Java代碼時都會把內存分爲幾個部分,即數據區來使用,這些區域都擁有自己的用途,並隨着JVM進程的啓動或者用戶線程的啓動和結束建立和銷燬。

『互聯網架構』軟件架構-JVM(上)

  • Program Counter Register

    作用
    當前線程執行的字節碼的行號指示器,通過改變此指示器來選取下一個需要執行的字節碼指令

特徵
1.在線程創建時創建
2.每個線程擁有一個
3.指向下一條指令的地址


  • Method Area(Non-Heap)

    線程共享

存儲
1.類信息
2.常量
3.靜態變量
4.方法字節碼



  • VM Stack / Native Method Stack

    線程私有

方法在執行時會創建一個棧幀(Stack Frame)用於存儲局部變量表、操作數棧、動態鏈接、方法出口等信息

方法從調用直至執行完成的過程,就對應着一個棧幀在虛擬機棧中入棧到出棧的過程

局部變量表所需的內存空間在編譯期間完成分配,而且分配多大的局部變量空間是完全確定的,在方法運行期間不會改變其大小

出棧後空間釋放

  • Heap

    線程共享

存儲對象或數組

Heap劃分

『互聯網架構』軟件架構-JVM(上)

  • JMM

線程工作內存,主內存

JMM模型

『互聯網架構』軟件架構-JVM(上)

PS:梳理了JVM的概念,以及JVM和JDK的關係,爲什麼用JVM,JVM的認識,JVM的運行流程,class文件被JVM執行引擎,加載到數據區中,編譯到操作系統識別的指令,針對操作系統不同的指令。JVM針對不同操作系統進行了class只有一份。實現跨平臺。JVM的運行數據區分爲線程共享的數據區(方法,堆)和線程獨立的數據區(棧,程序計數器)。JVM真的基本上都是文字的東西。可能比較難理解,有工作經驗稍微好理解些。確實太底層了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章