嵌入式Linux&Java for ARM

首先需要了解一些概念:
浮點運算是指浮點數參與的運算,因爲無法精確表示而進行近似或舍入。浮點運算就是實數運算,因爲計算機只能存儲整數,所以實數都是約數,這樣浮點運算是很慢的而且會有誤差。假如一臺機器是32位的,32位都用來表示整數的話,那麼對於無符號整數就是0到2^32-1,對於有符號的話就是-2^31到2^31-1。
浮點運算單元是專用於浮點運算的處理單元,以前的FPU是一種單獨芯片,在486之後,英特爾把FPU集成在CPU之內。
VFP (Vector Floating Point)從ARMv5開始,就有可選的 VFP模塊,當然如 Cortex-A8, Cortex-A9 和 Cortex-A5 可以配置成不帶VFP的模式供芯片廠商選擇。VFP經過若干年的發展,有VFPv2 (一些 ARM9 / ARM11)、 VFPv3-D16(只使用16個浮點寄存器,默認爲32個)和VFPv3+NEON (如大多數的Cortex-A8芯片)。對於包含NEON的ARM芯片,NEON一般和VFP共用寄存器。


硬浮點Hard-float
編譯器將代碼直接編譯成發射給硬件浮點協處理器(浮點運算單元FPU)去執行。FPU通常有一套額外的寄存器來完成浮點參數傳遞和運算。


軟浮點 Soft-float
編譯器把浮點運算轉換成浮點運算的函數調用和庫函數調用,沒有FPU的指令調用,也沒有浮點寄存器的參數傳遞。浮點參數的傳遞也是通過ARM寄存器或者堆棧完成。 現在的Linux系統默認編譯選擇使用hard-float,即使系統沒有任何浮點處理器單元,這就會產生非法指令和異常。因而一般的系統鏡像都採用軟浮點以兼容沒有VFP的處理器。


armel和armhf ABI
在armel中,關於浮點數計算的約定有三種。以gcc爲例,對應的-mfloat-abi參數值有三個:soft,softfp,hard。
soft是指所有浮點運算全部在軟件層實現,效率當然不高,會存在不必要的浮點到整數、整數到浮點的轉換,只適合於早期沒有浮點計算單元的ARM處理器;softfp是目前armel的默認設置,它將浮點計算交給FPU處理,但函數參數的傳遞使用通用的整型寄存器而不是FPU寄存器;
hard則使用FPU浮點寄存器將函數參數傳遞給FPU處理。
需要注意的是,在兼容性上,soft與後兩者是兼容的,但softfp和hard兩種模式不兼容。默認情況下,armel使用softfp,因此將hard模式的armel單獨作爲一個abi,稱之爲armhf。而使用hard模式,在每次浮點相關函數調用時,平均能節省20個CPU週期。對ARM這樣每個週期都很重要的體系結構來說,這樣的提升無疑是巨大的。在完全不改變源碼和配置的情況下,在一些應用程序上,使用armhf能得到20%——25%的性能提升。對一些嚴重依賴於浮點運算的程序,更是可以達到300%的性能提升。


Soft-float和hard-float的編譯選項
kernel、rootfs和app編譯的時候,指定的必須保持一致才行。
在CodeSourcery gcc的編譯參數上,使用-mfloat-abi=name來指定浮點運算處理方式。-mfpu=name來指定浮點協處理的類型。可選類型如fpa,fpe2,fpe3,maverick,vfp,vfpv3,vfpv3-fp16,vfpv3-d16,vfpv3-d16-fp16,vfpv3xd,vfpv3xd-fp16,neon,neon-fp16,vfpv4,vfpv4-d16,fpv4-sp-d16,neon-vfpv4等。使用-mfloat-abi=hard (等價於-mhard-float) -mfpu=vfp來選擇編譯成硬浮點。使用-mfloat-abi=softfp就能兼容帶VFP的硬件以及soft-float的軟件實現,運行時的連接器ld.so會在執行浮點運算時對於運算單元的選擇,是直接的硬件調用還是庫函數調用,是執行/lib還是/lib/vfp下的libm。-mfloat-abi=soft (等價於-msoft-float)直接調用軟浮點實現庫。


armhf的開啓需要硬件的支持,在Debian的wiki上要求ARMv7 CPU、Thumb-2指令集以及VFP3D16浮點處理器。
在gcc的編譯參數上,使用-mfloat-abi=hard -mfpu=vfp即可。
在工具上,CodeSourcery最早支持hard模式。或者,也可已自己編譯工具鏈。


ARM的Jazelle技術使Java加速得到比基於軟件的Java虛擬機(JVM)高得多的性能,和同等的非Java加速核相比功耗降低80%。CPU功能上增加DSP指令集提供增強的16位和32位算術運算能力,提高了性能和靈活性。ARM微處理器的在較新的體系結構中支持兩種指令集:ARM指令集和Thumb指令集。其中,ARM指令爲32位的長度,Thumb指令爲16位長度。Thumb指令集爲ARM指令集的功能子集,但與等價的ARM代碼相比較,可節省30%~40%以上的存儲空間,同時具備32位代碼的所有優點。


體系結構
1 CISC(Complex Instruction Set Computer,複雜指令集計算機)
在CISC指令集的各種指令中,大約有20%的指令會被反覆使用,佔整個程序代碼的80%。而餘下的80%的指令卻不經常使用,在程序設計中只佔20%。
2 RISC(Reduced Instruction Set Computer,精簡指令集計算機)
RISC結構優先選取使用頻最高的簡單指令,避免複雜指令;將指令長度固定,指令格式和尋地方式種類減少;以控制邏輯爲主,不用或少用微碼控制等。

ARM和Intel處理器的第一個區別是,前者使用精簡指令集(RISC),而後者使用複雜指令集(CISC)。

瞭解了以上那些概念,其實真正將Java虛擬機移植到arm上很簡單,主要是出現一些問題就可能要參考上述那些概念了,可能要做一些小的修改。直接去Oracle官網下載arm版本的JDK,解壓後拷貝到嵌入式Linux操作系統中,一般是eMMC或SD卡上。然後配置一下環境變量就可以了,可以在系統profile文件中進行配置,如果每次系統重啓profile文件又變回原來的樣子的話,可以在系統啓動初始化腳本文件中進行設置。
  export JAVA_HOME=/run/media/mmcblk0p1/jdk1.8.0_131
  export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
  export PATH=$JAVA_HOME/bin:$PATH

參考鏈接:http://www.th7.cn/system/lin/201507/122029.shtml    http://www.veryarm.com/872.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章