ARM Linux啓動過程分析

+++ 轉載 +++

摘 要: 對於不同體系結構的處理器來說Linux的啓動過程也有所不同。本文以S3C2410 ARM處理器爲例, 詳細分析了系統上電後 bootloader的執行流程及 ARM Linux的啓動過程。

一個嵌入式 Linux 系統從軟件角度看可以分爲四個部分:
1,引導加載程序(bootloader)
2,Linux 內核

3,文件系統
4,應用程序

其中 bootloader是系統啓動或復位以後執行的第一段代碼,它主要用來初始化處理器及
外設,然後調用 Linux 內核。Linux 內核在完成系統的初始化之後需要掛載某個文件系統做
爲根文件系統(Root Filesystem)。根文件系統是 Linux 系統的核心組成部分,它可以做爲
Linux 系統中文件和數據的存儲區域,通常它還包括系統配置文件和運行應用軟件所需要的
庫。應用程序可以說是嵌入式系統的“靈魂”,它所實現的功能通常就是設計該嵌入式系統
所要達到的目標。如果沒有應用程序的支持,任何硬件上設計精良的嵌入式系統都沒有實用
意義。
從以上分析我們可以看出 bootloader 和 Linux 內核在嵌入式系統中的關係和作用。
Bootloader在運行過程中雖然具有初始化系統和執行用戶輸入的命令等作用,但它最根本的
功能就是爲了啓動 Linux 內核。在嵌入式系統開發的過程中,很大一部分精力都是花在
bootloader 和 Linux 內核的開發或移植上。如果能清楚的瞭解 bootloader 執行流程和 Linux
的啓動過程,將有助於明確開發過程中所需的工作,從而加速嵌入式系統的開發過程。而這
正是本文的所要研究的內容。

2. Bootloader
2.1 Bootloader的概念和作用
Bootloader是嵌入式系統的引導加載程序,它是系統上電後運行的第一段程序,其作用
類似於 PC 機上的 BIOS。在完成對系統的初始化任務之後,它會將非易失性存儲器(通常
是 Flash或 DOC 等)中的Linux 內核拷貝到 RAM 中去,然後跳轉到內核的第一條指令處繼
續執行,從而啓動 Linux 內核。
由此可見,bootloader 和 Linux 內核有着密不可分的聯繫,要想清楚的瞭解 Linux內核
的啓動過程,我們必須先得認識 bootloader的執行過程,這樣才能對嵌入式系統的整個啓動
過程有清晰的掌握。
2.2 Bootloader的執行過程
不同的處理器上電或復位後執行的第一條指令地址並不相同,對於 ARM 處理器來說,
該地址爲 0x00000000。對於一般的嵌入式系統,通常把 Flash 等非易失性存儲器映射到這個
地址處,而 bootloader就位於該存儲器的最前端,所以系統上電或復位後執行的第一段程序
便是 bootloader。而因爲存儲 bootloader的存儲器不同,bootloader的執行過程也並不相同,
下面將具體分析。
嵌入式系統中廣泛採用的非易失性存儲器通常是 Flash,而 Flash 又分爲 Nor Flash 和
Nand Flash 兩種。 它們之間的不同在於: Nor Flash 支持芯片內執行(XIP, eXecute In Place),
這樣代碼可以在Flash上直接執行而不必拷貝到RAM中去執行。而Nand Flash並不支持XIP,
所以要想執行 Nand Flash 上的代碼,必須先將其拷貝到 RAM中去,然後跳到 RAM 中去執
行。
實際應用中的 bootloader根據所需功能的不同可以設計得很複雜,除完成基本的初始化
系統和調用 Linux 內核等基本任務外,還可以執行很多用戶輸入的命令,比如設置 Linux 啓
動參數,給 Flash 分區等;也可以設計得很簡單,只完成最基本的功能。但爲了能達到啓動
Linux 內核的目的,所有的 bootloader都必須具備以下功能:
1) 初始化 RAM
因爲 Linux 內核一般都會在 RAM 中運行,所以在調用 Linux 內核之前 bootloader 必須
設置和初始化 RAM,爲調用 Linux內核做好準備。初始化 RAM 的任務包括設置 CPU 的控
制寄存器參數,以便能正常使用 RAM 以及檢測RAM 大小等。
2) 初始化串口
串口在 Linux 的啓動過程中有着非常重要的作用,它是 Linux內核和用戶交互的方式之
一。Linux 在啓動過程中可以將信息通過串口輸出,這樣便可清楚的瞭解 Linux 的啓動過程。
雖然它並不是 bootloader 必須要完成的工作,但是通過串口輸出信息是調試 bootloader 和
Linux 內核的強有力的工具,所以一般的 bootloader 都會在執行過程中初始化一個串口做爲
調試端口。
3) 檢測處理器類型
Bootloader在調用 Linux內核前必須檢測系統的處理器類型,並將其保存到某個常量中
提供給 Linux 內核。Linux 內核在啓動過程中會根據該處理器類型調用相應的初始化程序。
4) 設置 Linux啓動參數
Bootloader在執行過程中必須設置和初始化 Linux 的內核啓動參數。目前傳遞啓動參數
主要採用兩種方式:即通過 struct param_struct 和struct tag(標記列表,tagged list)兩種結
構傳遞。struct param_struct 是一種比較老的參數傳遞方式,在 2.4 版本以前的內核中使用較
多。從 2.4 版本以後 Linux 內核基本上採用標記列表的方式。但爲了保持和以前版本的兼容
性,它仍支持 struct param_struct 參數傳遞方式,只不過在內核啓動過程中它將被轉換成標
記列表方式。
標記列表方式是種比較新的參數傳遞方式,它必須以 ATAG_CORE 開始,並以
ATAG_NONE 結尾。中間可以根據需要加入其他列表。Linux內核在啓動過程中會根據該啓
動參數進行相應的初始化工作。
5) 調用 Linux內核映像 
Bootloader完成的最後一項工作便是調用 Linux內核。如果 Linux 內核存放在 Flash 中,
並且可直接在上面運行(這裏的 Flash 指 Nor Flash),那麼可直接跳轉到內核中去執行。
但由於在 Flash 中執行代碼會有種種限制,而且速度也遠不及 RAM 快,所以一般的嵌
入式系統都是將 Linux內核拷貝到 RAM 中,然後跳轉到 RAM 中去執行。
不論哪種情況,在跳到 Linux 內核執行之前 CUP的寄存器必須滿足以下條件:r0=0,
r1=處理器類型,r2=標記列表在 RAM中的地址。

3. Linux內核的啓動過程
在 bootloader將 Linux 內核映像拷貝到 RAM 以後,可以通過下例代碼啓動 Linux 內核:
call_linux(0, machine_type, kernel_params_base)。 
其中,machine_tpye 是 bootloader檢測出來的處理器類型, kernel_params_base 是啓動參
數在 RAM 的地址。通過這種方式將 Linux 啓動需要的參數從 bootloader傳遞到內核。
Linux 內核有兩種映像:一種是非壓縮內核,叫 Image,另一種是它的壓縮版本,叫
zImage。根據內核映像的不同,Linux 內核的啓動在開始階段也有所不同。zImage 是 Image
經過壓縮形成的,所以它的大小比 Image 小。但爲了能使用 zImage,必須在它的開頭加上
解壓縮的代碼,將 zImage 解壓縮之後才能執行,因此它的執行速度比 Image 要慢。但考慮
到嵌入式系統的存儲空容量一般比較小,採用 zImage 可以佔用較少的存儲空間,因此犧牲
一點性能上的代價也是值得的。所以一般的嵌入式系統均採用壓縮內核的方式。

對於 ARM 系列處理器來說,zImage 的入口程序即爲 arch/arm/boot/compressed/head.S。
它依次完成以下工作:開啓 MMU 和 Cache,調用 decompress_kernel()解壓內核,最後通過
調用 call_kernel()進入非壓縮內核 Image 的啓動。下面將具體分析在此之後 Linux 內核的啓
動過程。
3.1 Linux內核入口
Linux 非壓縮內核的入口位於文件/arch/arm/kernel/head-armv.S 中的 stext 段。該段的基
地址就是壓縮內核解壓後的跳轉地址。如果系統中加載的內核是非壓縮的 Image,那麼
bootloader將內核從 Flash中拷貝到 RAM 後將直接跳到該地址處,從而啓動 Linux 內核。 
不同體系結構的 Linux 系統的入口文件是不同的,而且因爲該文件與具體體系結構有
關,所以一般均用彙編語言編寫。

對基於 ARM 處理的 Linux 系統來說,該文件就是
head-armv.S。該程序通過查找處理器內核類型和處理器類型調用相應的初始化函數,再建
立頁表,最後跳轉到 start_kernel()函數開始內核的初始化工作。
檢測處理器內核類型是在彙編子函數__lookup_processor_type中完成的。通過以下代碼
可實現對它的調用:
                           bl     __lookup_processor_type

__lookup_processor_type調用結束返回原程序時,會將返回結果保存到寄存器中。其中
r8 保存了頁表的標誌位,r9 保存了處理器的 ID 號,r10 保存了與處理器相關的 stru
proc_info_list 結構地址。
檢測處理器類型是在彙編子函數 __lookup_architecture_type 中完成的。與
__lookup_processor_type類似,它通過代碼:
                          bl __lookup_processor_type
來實現對它的調用。該函數返回時,會將返回結構保存在 r5、r6 和 r7 三個寄存器中。其中 r5 保存了 RAM 的起始基地址,r6 保存了 I/O基地址,r7 保存了 I/O的頁表偏移地址。 

當檢測處理器內核和處理器類型結束後,將調用
                          __create_page_tables
子函數來建立頁 表,它所要做的工作就是將 RAM 基地址開始的 4M 空間的物理地址映射到 0xC0000000 開 始的虛擬地址處。對筆者的 S3C2410 開發板而言,RAM 連接到物理地址 0x30000000 處, 當調用 __create_page_tables 結束後 0x30000000 ~ 0x30400000 物理地址將映射到 0xC0000000~0xC0400000 虛擬地址處。

當所有的初始化結束之後,使用如下代碼來跳到 C 程序的入口函數 start_kernel()處,開
始之後的內核初始化工作:
                            b SYMBOL_NAME(start_kernel)


3.2 start_kernel函數
start_kernel是所有 Linux 平臺進入系統內核初始化後的入口函數,它主要完成剩餘的與
硬件平臺相關的初始化工作,在進行一系列與內核相關的初始化後,調用第一個用戶進程-
init 進程並等待用戶進程的執行,這樣整個 Linux 內核便啓動完畢。該函數所做的具體工作
有:
     1) 調用 setup_arch()函數進行與體系結構相關的第一個初始化工作;
          對不同的體系結構來說該函數有不同的定義。對於 ARM 平臺而言,該函數定義在
         arch/arm/kernel/Setup.c。它首先通過檢測出來的處理器類型進行處理器內核的初始化,

        然後通過 bootmem_init()函數根據系統定義的 meminfo 結構進行內存結構的初始化,
         最後調用 paging_init()開啓 MMU,創建內核頁表,映射所有的物理內存和 IO空間。
      2) 創建異常向量表和初始化中斷處理函數;
      3) 初始化系統核心進程調度器和時鐘中斷處理機制;
      4) 初始化串口控制檯(serial-console); 
            ARM-Linux 在初始化過程中一般都會初始化一個串口做爲內核的控制檯,這樣內核在
            啓動過程中就可以通過串口輸出信息以便開發者或用戶瞭解系統的啓動進程。
      5) 創建和初始化系統 cache,爲各種內存調用機制提供緩存,包括;動態內存分配,虛擬文
           件系統(VirtualFile System)及頁緩存。
      6) 初始化內存管理,檢測內存大小及被內核佔用的內存情況;
      7) 初始化系統的進程間通信機制(IPC);

當以上所有的初始化工作結束後,start_kernel()函數會調用 rest_init()函數來進行最後的
初始化,包括創建系統的第一個進程-init 進程來結束內核的啓動。
Init 進程首先進行一系 列的硬件初始化,然後通過命令行傳遞過來的參數掛載根文件系統。最後 init 進程會執行用 戶傳遞過來的“init=”啓動參數執行用戶指定的命令,或者執行以下幾個進程之一:
execve("/sbin/init",argv_init,envp_init);
execve("/etc/init",argv_init,envp_init);
execve("/bin/init",argv_init,envp_init);
execve("/bin/sh",argv_init,envp_init)。
當所有的初始化工作結束後,cpu_idle()函數會被調用來使系統處於閒置(idle)狀態並
等待用戶程序的執行。至此,整個 Linux 內核啓動完畢。

4. 結論
Linux 內核是一個非常龐大的工程,經過十多年的發展,它已從從最初的幾百 KB 大小
發展到現在的幾百兆。清晰的瞭解它執行的每一個過程是件非常困難的事。但是在嵌入式開
發過程中,我們並不需要十分清楚 linux 的內部工作機制,只要適當修改 linux 內核中那些
與硬件相關的部分,就可以將 linux 移植到其它目標平臺上。通過對 linux 的啓動過程的分
析,我們可以看出哪些是和硬件相關的,哪些是 linux 內核內部已實現的功能,這樣在移植
linux 的過程中便有所針對。而 linux內核的分層設計將使 linux 的移植變得更加容易。

參考文獻
[1] 詹榮開.嵌入式系統bootloader技術內幕[EB/OL]. http://www.ibm.com/developerworks/cn/linux/l-btloader
/index.html,2003.12.
[2] Russell King.Booting ARM Linux[Z].Linux Documentation.May 2002
[3] 劉淼.嵌入式系統接口設計與Linux驅動程序開發[M].北京航空航天大學出版社.2006.6
[4] William Gatliff. The Linux 2.4 Kernel’s Startup Procedure[DB/CD]. 2002 Embedded System Conference San
Francisco,March..2002
[5] Claudia Salzberg Rodriguez,Gordon Fischer,Steven Smolski.Linux內核編程[M].陳莉君,賀炎,劉霞林.機械工業出版社.2006.7 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章