深入理解Android虛擬機體系結構

1.什麼是Dalvik虛擬機

Dalvik虛擬機是Google公司自己設計用於Android平臺的Java虛擬機，它是Android平臺的重要組成部分，支持dex格式（Dalvik Executable）的Java應用程序的運行。dex格式是專門爲Dalvik設計的一種壓縮格式，適合內存和處理器速度有限的系統。Google對其進行了特定的優化，使得Dalvik具有高效、簡潔和節省資源的特點。從Android系統架構圖可知，Dalvik虛擬機運行在Android的運行時庫層

2.Dalvik虛擬機的功能

Dalvik作爲面向Linux、爲嵌入式操作系統涉及的虛擬機，主要負責完成對象生命週期管理、堆棧管理、線程管理、安全和異常管理，以及垃圾回收等。Dalvik充分利用Linux進程管理的特點，對其進行了面向對象設計，使得可以同時運行多個進程，而傳統的Java程序通常只能運行一個進程，這也是爲什麼Android不採用JVM的原因。Dalvik爲了達到優化的目的，底層的操作大多和系統內核相關，或者直接調用內核接口。另外，Dalvik早期並沒有JIT編譯器，直到Android2.2才加入了對JIT的技術支持。

3.Dalvik虛擬機和Java虛擬機的區別

本質上，Dalvik也是一個Java虛擬機。但它特別之處在於沒有使用JVM規範。大多數Java虛擬機都是基於棧的結構，而Dalvik虛擬機則是基於寄存器。基於棧的指令很緊湊，例如，Java虛擬機使用的指令只佔一個字節，因而稱爲字節碼。基於寄存器的指令由於需要指定源地址和目標地址，因此需要佔用更多的指令空間。Dalvik虛擬機的某些指令需要佔用兩個字節。基於棧和基於寄存器的指令集各有優劣，一般而言，執行同樣的功能，前者需要更多的指令（主要是load和store指令），而後者需要更多的指令空間。需要更多指令意味着多佔用CPU時間，而需要更多指令空間意味着數據緩衝（d-cache）更易失效。

Java虛擬機運行的是Java字節碼，而Dalvik虛擬機運行的是專有文件格式dex。在Java程序中，Java類會被編譯成一個或者多個class文件，然後打包到jar文件中，接着Java虛擬機會從相應的class文件和jar文件中獲取對應的字節碼。Android應用雖然也使用Java語言，但是在編譯成class文件後，還會通過DEX工具將所有的class文件轉換成一個dex文件，Dalvik虛擬機再從讀取指令和數據。dex文件除了減少整體的文件尺寸和I/O操作次數，也提高了類的查找速度。

由上圖可以看到，jar和apk文件的組成結構，以及class文件和dex文件的差異。dex格式文件使用共享的、特定類型的常量池機制類節省內存。常量池存儲類中的所有字面常量，它包括字符串常量、字段常量等值。

總的來說，Dalvik虛擬機具有以下的特點：

使用dex格式的字節碼，不兼容Java字節碼格式
代碼密度小，運行效率高，節省資源
常量池只使用32位的索引
有內存限制
默認棧大小是12KB（3個頁，每頁4KB）
堆默認啓動大小爲2MB，默認最大值爲16MB
堆支持的最小啓動大小爲1MB，支持的最大值爲1024MB
堆和棧參數可以通過-Xms和-Xmx修改

4.Dalvik系統結構

實際上，Dalvik是基於Apache Harmony（Apache軟件基金會的Java SE項目）的部分實現，提供了自己的一套庫，即上層Java應用程序編寫所使用的API。

以上圖示來自tech-insider。Apache Harmony大體上分爲三層：操作系統、Java虛擬機和Java類庫。它的特定在於虛擬機和類庫內部被高度模塊化，每一個模塊都有一定的接口定義。操作系統層和虛擬機層之間的接口由Portability Layer定義，它封裝了不同的操作系統的差異，爲虛擬機和類庫的本地代碼提供了一套統一的API訪問底層系統調用。虛擬機和類庫之間的接口除了Java規範定義的JNI、JVMITI外，還加入了一層虛擬機接口，由內核類和本地代碼組成。實現了虛擬機接口的虛擬機都可以使用Harmony的類庫實現，並且可以被Harmony提供的同一個Java啓動程序啓動。

下面是Dalvik虛擬機的結構圖：

一個應用首先經過DX工具將class文件轉換成Dalvik虛擬機可以執行的dex文件，然後由類加載器加載原生類和Java類，接着由解釋器根據指令集對Dalvik字節碼進行解釋、執行。最後，根據dvm_arch參數選擇編譯的目標機體系結構。

4.1 dex文件結構

dex文件結構和class文件結構差異的地方很多，但從攜帶的信息上看，dex和class文件是一直的。

header：存儲了各個數據類型的起始地址、偏移量等信息。
proto_ids:描述函數原型信息，包括返回值，參數信息。比如“test:()V”
methods_ids:函數信息，包括所屬類及對應的proto信息。

雖然dex文件的結構很緊湊，但想要運行時的性能得到進一步提升，還需要對dex文件進行進一步優化。優化主要針對以下幾個方面：

調整所有字段的字節序和對齊結構中的每一個域
驗證dex文件中的所有類
對一些特定的類進行優化，對方法裏的操作碼進行優化

dex文件經過優化後文件大小會膨脹，大約增加到原來的1~4倍。對於內置應用，一般在系統編譯後，便會生成優化文件（odex：Optimized dex）。一個Android引用程序，需要經過以下過程纔可以在Dalvik虛擬機上運行：

把Java源文件編譯成class文件
使用DX工具把class文件轉換成dex文件
使用aapt工具把dex文件、資源文件以及AndroidManifest.xml文件（二進制格式）組合成APK
將APK安裝到Android設備運行

上圖（來自網絡）詳盡地展示了最終簽名後的APK是怎麼來的。

4.2 Dalvik類加載器

一個dex文件需要類加載器加載原生類和Java類，然後通過解釋器根據指令集對Dalvik字節碼進行解釋和執行。Dalvik類加載器使用mmap函數，將dex文件映射到內存中，通過普通的內存讀取操作即可訪問dex文件，然後解析dex文件內容並加載其中的類到哈希表中。

4.2.1 解析dex

總的來說，dex文件可以抽象爲三個部分：頭部、索引和數據。通過頭部可以知道索引的位置和數目，以及數據區的起始位置。將dex文件映射到內存後，Dalvik會調用dexFileParse函數對其進行分析，分析的結果放到DexFile數據結構中。DexFile中的baseAddr指向映射區的起始位置，pClassDefs指向class索引的起始位置。爲了加快class的查找速度，還創建一個哈希表，對class名字進行了哈希並生成索引。

4.2.2 加載class

解析工作完成後就進行class的加載，加載的類需要用ClassObject數據結構來存儲。

typedef struct Object {

ClassObject* clazz; //類型對象

Lock lock; //鎖對象

} Object

其中clazz指向ClassObject對象，還包含一個Lock對象。如果其它線程想要獲取它的鎖，只有等這個線程釋放。Dalvik每加載一個class都會對應一個ClassObject對象，加載過程會在內存中分配幾個區域，分別存放directMethod，virtualMethod、sfiled和ifiled。這些信息從dex文件的數據區中讀取。

得到class索引後，實際的加載由loadClassFromDex來完成。首先會讀取class的具體數據，分別加載directMethod，virtualMethod、ifield和sfield，然後爲ClassObject數據結構分配內存，並讀取dex文件的相關信息。加載完成後，將加載的class通過dvmAddClassToHash函數放入哈希表，以方便下次查找；最後，通過dvmLinkClass查找該類的超類，如果有接口類則加載相應的接口類。

4.3 Dalvik解釋器

對於任何虛擬機來說，解釋器無疑是核心的部分，所有的Java字節碼都經過解釋器解釋執行。由於Dalvik解釋器的效率很重要，Android分別實現了C語言版和各種彙編語言版的解釋器。解釋器通常是循環執行，需要一個入口函數調用處理程序執行第一條指令，而後每條指令執行時引出下一條指令，通過函數指針調用處理程序。

4.4 內存管理

垃圾收集是Dalvik虛擬機內存管理的核心。此處只接受Dalvik虛擬機的垃圾收集功能。垃圾收集的性能在很大程度上影響一個Java程序內存使用的效率。Dalvik虛擬機使用常用的Mark-Sweep算法，該算法分Mark階段（標記出活動對象）、Sweep階段（回收垃圾內存）和可選的Compact階段（減少堆中的碎片）。

垃圾收集的第一步是標記出活動對象，因爲沒有辦法識別那些不可訪問的對象，這樣所有未被標記的對象就是可以回收的垃圾。當進行垃圾收集時，需要停止Dalvik虛擬機的運行（除垃圾收集外），因此垃圾收集又被稱作STW（stop-the-world）。Dalvik虛擬機在運行過程中要維護一些狀態信息，這些信息包括：每個線程所保存的寄存器、Java類中的靜態字段、局部和全局的JNI引用，JVM中的所有函數調用會對應一個相應C的棧幀。每一個棧幀裏可能包含對對象的引用，比如包含對象引用的局部變量和參數。所有這些引用信息被加入到一個根集合中，然後從根集合開始，遞歸查找可以從根集合出發訪問的對象。因此，Mark過程又叫做追蹤，追蹤所有可被訪問的對象。

垃圾收集的第二步就是回收內存。在Mark階段通過markBits位圖可以得到所有可訪問的對象集合，而liveBits位圖表示所有已經分配的對象集合。通過比較liveBits位圖和markBits位圖的差異就是所有可回收的對象集合。Sweep階段調用free來釋放這些內存給堆。

在底層內存實現上，Android系統使用的是msspace，這是一個輕量級的malloc實現。除了創建和初始化用於存儲普通Java對象的內存堆，Android還創建三個額外的內存堆：

"livebits"（用來存放堆上內存被佔用情況的位圖索引）
"markbits"（在GC時用於標註存活對象的位圖索引）
“markstack”（在GC中遍歷存活對象引用的標註棧）

虛擬機通過一個名爲gHs的全局HeapSource變量來操控GC內存堆，而HeapSource裏通過heaps數組可以管理多個堆（Heap），以滿足動態調整GC內存堆大小的要求。另外HeapSource裏還維護一個名爲"livebits"的位圖索引，以跟蹤各個堆（Heap）的內存使用情況。剩下兩個數據結構"markstack"和"markbits"都是用在垃圾回收階段。

上圖中"livebits"維護堆上已用的內存信息，而"markbits"這個位圖索引則指向存活的對象。 A、C、F、G、H對象需要保留，因此"markbits"分別指向他們（最後的H對象尚在標註過程中，因此沒有指針指向它）。而"markstack"就是在標註過程中跟蹤當前需要處理的對象要用到的標誌棧，此時其保存了正在處理的對象F、G和H。

4.5 Dalvik的啓動流程

Dalvik進程管理是依賴於linux的進程體系結構的，如要爲應用程序創建一個進程，它會使用linux的fork機制來複制一個進程。Zygote是一個虛擬機進程，同時也是一個虛擬機實例的孵化器，它通過init進程啓動。之前的文章有對此過程有詳細介紹：Android系統啓動分析(Init->Zygote->SystemServer->Home activity)。此處分析Dalvik虛擬機啓動的相關過程。

AndroidRuntime類主要做了以下幾件事情：

調用startVM創建一個Dalvik虛擬機，JNI_CreateJavaVM真正創建並初始化虛擬機實例
調用startReg註冊Android核心類的JNI方法
通過Zygote進程進入Java層

在JNI中，dvmCreateJNIEnv爲當前線程創建和初始化一個JNI環境，即一個JNIEnvExt對象。最後調用dvmStartup來初始化前面創建的Dalvik虛擬機實例。函數dvmInitZygote調用了系統的setpgid來設置當前進程，即Zygote進程的進程組ID。這一步完成後，Dalvik虛擬機的創建和初始化工作就完成了。

5 Android的啓動

啓動電源，加載引導程序到RAM
BootLoader引導
Linux Kernel啓動
Init進程創建
Init fork出Zygote進程，Zygote進程創建虛擬機；創建系統服務
Android Home Launcher啓動

參考：

《Android技術內幕》

Dalvik虛擬機簡要介紹和學習計劃

深入理解Android（二）：Java虛擬機Dalvik

dalvik虛擬內存管理之二——垃圾收集

Dalvik虛擬機的啓動過程分析

深入理解Android虛擬機體系結構

1.什麼是Dalvik虛擬機

2.Dalvik虛擬機的功能

3.Dalvik虛擬機和Java虛擬機的區別

4.Dalvik系統結構

4.1 dex文件結構

4.2 Dalvik類加載器

4.2.1 解析dex

4.2.2 加載class

4.3 Dalvik解釋器

4.4 內存管理

4.5 Dalvik的啓動流程

5 Android的啓動

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

linux安裝cuda和cudnn

Mellanox網卡開啓SR-IOV

模擬手機設備：使用 Playwright 實現移動端自動化測試

HTML 00 Tutorial

全面系統的AI學習路徑，幫助普通人也能玩轉AI

從零開始：使用 Playwright 腳本錄製實現自動化測試

uni-app實現上拉加載

深入理解Android虛擬機體系結構

4 行代碼實現 ANDROID 快速文件下載

Android五大布局詳解

Android源碼添加自定義系統服務

Android 安全架構及權限控制機制剖析

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結