計算機的啓動過程

【轉】計算機的啓動

boot的含義

    先問一個問題,”啓動”用英語怎麼說?

回答是boot。可是,boot原來的意思是靴子,”啓動”與靴子有什麼關係呢? 原來,這裏的boot是bootstrap(鞋帶)的縮寫,它來自一句諺語:

"pull oneself up by one's bootstraps"

字面意思是”拽着鞋帶把自己拉起來”,這當然是不可能的事情。最早的時候,工程師們用它來比喻,計算機啓動是一個很矛盾的過程:必須先運行程序,然後計算機才能啓動,但是計算機不啓動就無法運行程序!

早期真的是這樣,必須想盡各種辦法,把一小段程序裝進內存,然後計算機才能正常運行。所以,工程師們把這個過程叫做”拉鞋帶”,久而久之就簡稱爲boot了。

計算機的整個啓動過程分成四個階段。

一、第一階段:BIOS

上個世紀70年代初,”只讀內存”(read-only memory,縮寫爲ROM)發明,開機程序被刷入ROM芯片,計算機通電後,第一件事就是讀取它。

BIOS

這塊芯片裏的程序叫做”基本輸出輸入系統”(Basic Input/Output System),簡稱爲BIOS。

1.1 硬件自檢

BIOS中主要存放的程序包括:自診斷程序(通過讀取CMOS RAM中的內容識別硬件配置,並對其進行自檢和初始化)、CMOS設置程序(引導過程中,通過特殊熱鍵啓動,進行設置後,存入CMOS RAM中)、系統自動裝載程序(在系統自檢成功後,將磁盤相對0道0扇區上的引導程序裝入內存使其運行)和主要I/O驅動程序和中斷服務(BIOS和硬件 直接打交道,需要加載I/O驅動程序)。

BIOS程序首先檢查,計算機硬件能否滿足運行的基本條件,這叫做”硬件自檢”(Power-On Self-Test),縮寫爲POST。

如果硬件出現問題,主板會發出不同含義的蜂鳴,啓動中止。如果沒有問題,屏幕就會顯示出CPU、內存、硬盤等信息。

1.2 啓動順序

硬件自檢完成後,BIOS把控制權轉交給下一階段的啓動程序。

這時,BIOS需要知道,”下一階段的啓動程序”具體存放在哪一個設備。也就是說,BIOS需要有一個外部儲存設備的排序,排在前面的設備就是優先轉交控制權的設備。這種排序叫做”啓動順序”(Boot Sequence)。

打開BIOS的操作界面,裏面有一項就是”設定啓動順序”。

BIOS Sequence

二、第二階段:主引導記錄

BIOS按照”啓動順序”,把控制權轉交給排在第一位的儲存設備。即根據用戶指定的引導順序從軟盤、硬盤或是可移動設備中讀取啓動設備的MBR,並放入指定的位置(0x7c000)內存中。

這時,計算機讀取該設備的第一個扇區,也就是讀取最前面的512個字節。如果這512個字節的最後兩個字節是0x55和0xAA,表明這個設備可以用於啓動;如果不是,表明設備不能用於啓動,控制權於是被轉交給”啓動順序”中的下一個設備。

這最前面的512個字節,就叫做”主引導記錄”(Master boot record,縮寫爲MBR)。

2.1 主引導記錄的結構

“主引導記錄”只有512個字節,放不了太多東西。它的主要作用是,告訴計算機到硬盤的哪一個位置去找操作系統。

主引導記錄由三個部分組成:

(1) 第1-446字節:調用操作系統的機器碼。
(2) 第447-510字節:分區表(Partition table)。
(3) 第511-512字節:主引導記錄簽名(0x55和0xAA)。

其中,第二部分”分區表”的作用,是將硬盤分成若干個區。

2.2 分區表

硬盤分區有很多好處。考慮到每個區可以安裝不同的操作系統,”主引導記錄”因此必須知道將控制權轉交給哪個區。

分區表的長度只有64個字節,裏面又分成四項,每項16個字節。所以,一個硬盤最多隻能分四個一級分區,又叫做”主分區”。

每個主分區的16個字節,由6個部分組成:

(1) 第1個字節:如果爲0x80,就表示該主分區是激活分區,控制權要轉交給這個分區。四個主分區裏面只能有一個是激活的。
(2) 第2-4個字節:主分區第一個扇區的物理位置(柱面、磁頭、扇區號等等)。
(3) 第5個字節:主分區類型。
(4) 第6-8個字節:主分區最後一個扇區的物理位置。
(5) 第9-12字節:該主分區第一個扇區的邏輯地址。
(6) 第13-16字節:主分區的扇區總數。

最後的四個字節(”主分區的扇區總數”),決定了這個主分區的長度。也就是說,一個主分區的扇區總數最多不超過2的32次方。

如果每個扇區爲512個字節,就意味着單個分區最大不超過2TB。再考慮到扇區的邏輯地址也是32位,所以單個硬盤可利用的空間最大也不超過2TB。如果想使用更大的硬盤,只有2個方法:一是提高每個扇區的字節數,二是增加扇區總數。

三、第三階段:硬盤啓動

這時,計算機的控制權就要轉交給硬盤的某個分區了,這裏又分成三種情況。

3.1 情況A:卷引導記錄

上一節提到,四個主分區裏面,只有一個是激活的。計算機會讀取激活分區的第一個扇區,叫做”卷引導記錄”(Volume boot record,縮寫爲VBR)。

“卷引導記錄”的主要作用是,告訴計算機,操作系統在這個分區裏的位置。然後,計算機就會加載操作系統了。

3.2 情況B:擴展分區和邏輯分區

隨着硬盤越來越大,四個主分區已經不夠了,需要更多的分區。但是,分區表只有四項,因此規定有且僅有一個區可以被定義成”擴展分區”(Extended partition)。

所謂”擴展分區”,就是指這個區裏面又分成多個區。這種分區裏面的分區,就叫做”邏輯分區”(logical partition)。

計算機先讀取擴展分區的第一個扇區,叫做”擴展引導記錄”(Extended boot record,縮寫爲EBR)。它裏面也包含一張64字節的分區表,但是最多隻有兩項(也就是兩個邏輯分區)。

計算機接着讀取第二個邏輯分區的第一個扇區,再從裏面的分區表中找到第三個邏輯分區的位置,以此類推,直到某個邏輯分區的分區表只包含它自身爲止(即只有一個分區項)。因此,擴展分區可以包含無數個邏輯分區。

但是,似乎很少通過這種方式啓動操作系統。如果操作系統確實安裝在擴展分區,一般採用下一種方式啓動。

3.3 情況C:啓動管理器

在這種情況下,計算機讀取”主引導記錄”前面446字節的機器碼之後,不再把控制權轉交給某一個分區,而是運行事先安裝的”啓動管理器”(boot loader),由用戶選擇啓動哪一個操作系統。

Linux環境中,目前最流行的啓動管理器是Grub。

Grub

對於grub而言,在MBR中的446字節的引導程序屬於GRUB的開始執行程序,通過這段程序,進一步執行stage1.5或是stage2的執行程序,將在下面詳細介紹執行過程。

其中stage1.5或是stage2便屬於階段2引導的過程了,stage2過程也是作爲GRUB kernel的核心代碼出現。Stage1.5過程(對於GRUB而言存在stage1.5,GRUB2則不存在)的功能很單一,主要就是爲了引導 stage2過程服務。由於stage2過程的代碼存放在文件系統下的boot分區目錄中,因此stage1.5過程就是需要提供一個文件系統的環境,而 該文件系統環境需要保證系統可以找到stage2過程的文件,那麼stage1.5階段提供的文件系統需要是boot文件系統所對應的,這個在執行 grub install過程中就已經確定了。stage2過程中,主要會把系統切換到保護模式,設置好C運行時環境,找到config文件(事實上就是 menulist文件),如果沒有找到就執行一個shell,等待用戶的執行。然後的工作就變成了輸入命令->解析命令->執行命令的循環 中。當然該階段引導的最終狀態就是執行boot命令,將內核和initrd鏡像加載進入內存中,進而將控制權轉交給內核。

四、第四階段:操作系統

控制權轉交給操作系統後,操作系統的內核首先被載入內存。

以Linux系統爲例,先載入/boot目錄下面的kernel。內核加載成功後,第一個運行的程序是/sbin/init。它根據配置文件 (Debian系統是/etc/initab)產生init進程。這是Linux啓動後的第一個進程,pid進程編號爲1,其他進程都是它的後代。

然後,init線程加載系統的各個模塊,比如窗口程序和網絡程序,直至執行/bin/login程序,跳出登錄界面,等待用戶輸入用戶名和密碼。

至此,全部啓動過程完成。

BIOS啓動細節:

a) 按下電源開關,電源就開始向主板和其它設備供電;當芯片組檢測到電源已經開始穩定供電了(當然從不穩定到穩定的過程只是一瞬間的事情),它便撤去 RESET信號(如果是手工按下計算機面板上的Reset按鈕來重啓機器,那麼鬆開該按鈕時芯片組就會撤去RESET信號);CPU馬上就從地址 FFFF:0000H 處開始執行指令,放在這裏的只是一條跳轉指令,跳到系統BIOS中真正的啓動代碼處。

b) 系統BIOS的啓動代碼首先進行POST(Power-On Self Test,加電後自檢)。POST的主要檢測系統中一些關鍵設備是否存在和能否正常工作,例如內存和顯卡等設備;由於POST是最早進行的檢測過程,此時 顯卡還沒有初始化,如果系統BIOS在進行POST的過程中發現了一些致命錯誤,例如沒有找到內存或者內存有問題(此時只會檢查640K常規內存),那麼 系統BIOS就會直接控制喇叭發聲來報告錯誤,聲音的長短和次數代表了錯誤的類型;在正常情況下,POST過程進行得非常快,幾乎無法感覺到它的存在。 POST結束之後就會調用其它代碼來進行更完整的硬件檢測。

c) 接下來系統BIOS將查找顯卡的BIOS。前面說過,存放顯卡BIOS的ROM芯片的起始地址通常設在C0000H處,系統BIOS在這個地方找到顯卡 BIOS之後就調用它的初始化代碼,由顯卡BIOS來初始化顯卡。此時多數顯卡都會在屏幕上顯示出一些初始化信息,介紹生產廠商、圖形芯片類型等內容,不 過這個畫面幾乎是一閃而過。系統BIOS接着會查找其它設備的BIOS程序,找到之後同樣要調用這些BIOS內部的初始化代碼來初始化相關的設備。

d) 查找完所有其它設備的BIOS之後,系統BIOS將顯示出它自己的啓動畫面,其中包括有系統BIOS的類型、序列號和版本號等內容。

e) 接着系統BIOS將檢測和顯示CPU的類型和工作頻率,測試所有的RAM,並同時在屏幕上顯示內存測試的進度。可以在CMOS設置中自行決定使用簡單耗時少或者詳細耗時多的測試方式。

f) 內存測試通過之後,系統BIOS將開始檢測系統中安裝的一些標準硬件設備,包括硬盤、CD-ROM、串口、並口和軟驅等設備,另外絕大多數較新版本的系統BIOS在這一過程中還要自動檢測和設置內存的定時參數、硬盤參數和訪問模式等。

g) 標準設備檢測完畢後,系統BIOS內部支持即插即用的代碼將開始檢測和配置系統中安裝的即插即用設備。每找到一個設備之後,系統BIOS都會在屏幕上顯示出設備的名稱和型號等信息,同時爲該設備分配中斷、DMA通道和I/O端口等資源。

h) 到這一步爲止,所有硬件都已經檢測配置完畢了,多數系統BIOS會重新清屏並在屏幕上方顯示出一個表格,其中概略地列出了系統中安裝的各種標準硬件設備,以及它們使用的資源和一些相關工作參數。

i) 接下來系統BIOS將更新ESCD(Extended System Configuration Data,擴展系統配置數據)。ESCD是系統BIOS用來與操作系統交換硬件配置信息的一種手段,這些數據被存放在CMOS(一小塊特殊的RAM,由主 板上的電池來供電)之中。通常ESCD數據只在系統硬件配置發生改變後纔會更新,所以不是每次啓動機器時都能夠看到“Update ESCD… Success”這樣的信息。不過,某些主板的系統BIOS在保存ESCD數據時使用了與Windows 9x不相同的數據格式,於是Windows 9x在它自己的啓動過程中會把ESCD數據修改成自己的格式。但在下一次啓動機器時,即使硬件配置沒有發生改變,系統BIOS也會把ESCD的數據格式改 回來。如此循環,將會導致在每次啓動機器時,系統BIOS都要更新一遍ESCD,這就是爲什麼有些機器在每次啓動時都會顯示出相關信息的原因。

j) ESCD更新完畢後,系統BIOS的啓動代碼將進行它的最後一項工作:即根據用戶指定的啓動順序從軟盤、硬盤或光驅啓動MBR。在這個過程中會按照啓動順 序順序比較其放置MBR的位置的結尾兩位是否爲0xAA55,通過這種方式判斷從哪個引導設備進行引導。在確定之後,將該引導設備的MBR內容讀入到 0x7C00[1]的位置,並再次判斷其最後兩位,當檢測正確之後,進行階段1的引導。

EFI啓動細節

與傳統MBR相比,GPT採用了不同的分區方式。

對於傳統MBR,其結構主要如下:

BIOS Graph

上圖即對上文中所述的很形象的說明,在圖中看到MBR被分成三個部分,分別是:Bootloader、分別表以及Magic Number。其中Bootloader部分爲stage1中被執行的起始部分。

相反,對於EFI系統中所採用的GPT分區方式,則採用了不同於MBR分區方式的形式,從下圖中可以發現:

EFI Graph

如上圖所示,GPT分區表主要包括:保護MBR、首要GPT頭、首要GPT、備用GPT、備用GPT頭和磁盤數據區。保護MBR與正常的MBR區別 不大,主要是分區表上的不同,在保護MBR中只要一個表示爲0xEE的分區,以此來表示這塊硬盤使用GPT分區表。首要GPT頭包含了衆多信息,具體內容 如下:

EFI Table

分區表頭定義了硬盤的可用空間以及組成分區表的項的大小和數量。分區表頭還記錄了這塊硬盤的GUID,記錄了分區表頭本身的位置和大小(位置總是在 LBA1)以及備份分區表頭和分區表的位置和大小(在硬盤的最後)。它還存儲着它本身和分區表的CRC32校驗。固件、引導程序和操作系統在啓動時可以根 據這個校驗值來判斷分區表是否有錯誤,如果出錯了,可以使用軟件從硬盤最後的備份GPT分區表恢復整個分區表,如果備份GPT也校驗錯誤,那麼磁盤將不可 用,系統拒絕啓動。

接下來主要是128個分區表項,GPT分區表使用簡單而直接的方式表示分區。一個分區表項的前16字節是分區類型GUID。例如,EFI系統分區的 GUID類型是{C12A7328-F81F-11D2-BA4B-00A0C93EC93B} 。接下來的16字節是該分區的唯一的GUID(這個指的是該分區本身,而之前的GUID指的是該分區的類型)。在接下來是分區其實和末尾的64位LBA編 號,以及分區的名字和屬性。具體結構如下表:

EFI Table2

MBR引導

接下來開始真正的引導過程了,主要說明GRUP的引導。總體上GRUB更像是一個mini os,只不過這個mini os的作用只是加載其他的操作系統,在GRUB中包括stage1、stage1.5(可選)和stage2,其中stage1和stage1.5屬於 boot loader,stage2屬於mini os的內核部分。GRUB中stage1過程主要位於MBR的前446字節中(對於支持GPT分區的磁盤,同樣有最開始的512字節作爲保護MBR,保護 MBR與正常的MBR區別不大,主要是分區表上的不同,在保護MBR中只要一個表示爲0xEE的分區,以此來表示這塊硬盤使用GPT分區表,不能識別 GPT硬盤的操作系統通常會識別出一個未知類型的分區,並且拒絕對硬盤進行操作),之後的64字節爲硬盤的分區表,最後兩個字節爲MBR結束標誌位 (0xAA55)。

stage1部分佔用了446字節,其代碼文件是源碼目錄下stage1/stage1.S文件,彙編後生成一個512字節的boot.img,被 寫在硬盤的0面0道1扇區中,作爲硬盤的MBR。stage1的工作很簡單,就是加載0面0道2扇區上的512字節到0×8000,然後跳轉到 0×8000執行。

在0面0道2扇區上的512字節內容爲stage1/start.S文件彙編後生成。該扇區上的內容的作用是加載stage1.5或是stage2過程,並將控制權轉交。

Grub引導

在start過程將控制權轉交後,接下來就是GRUB的核心過程了。該過程之所以區分stage1.5和stage2,主要原因是GRUB和 GRUB2的區別。在GRUB2中,將stage1.5過程集成到了stage2的過程中,所以stage1.5過程僅僅是針對GRUB的。下面將會分別 介紹兩種GRUB版本的兩種過程。

4.1 GRUB中stage1.5過程

Stage1.5過程很無辜,它的作用很單一,但是非常關鍵。它的主要功用就是構造一個boot分區系統對應的文件系統,這樣可以通過文件系統的路徑(/boot/grub/)尋找stage2過程需要的core.img,進而加載到內存中開始執行。

Stage1.5存在於0面0道3扇區開始的地方,並一直延續十幾k字節的區域,具體的大小與相應的文件系統的大小有關(文中涉及到了0面0道 1-3+x扇區,這部分扇區爲保留扇區,BIOS不會放置任何數據。正因爲如此如果轉換到GPT分區形式,系統將不能被正確引導,如上文所示,MBR後面 的扇區都被其他內容所佔據)。Stage1.5過程被構建成多種不同類型,但是功能類似,下面簡單介紹一下基本的stage1.5過程的文件系統。 e2fs_stage1_5(針對ext2fs,可引導ext2和ext3文件系統)、fat_stage1_5(針對fat文件系統,可引導fat32 和fat16)、ffs_stage1_5、jfs_stage1_5、minix_stage1_5、reiserfs_stage1_5、 vstafs_stage1_5和xfs_stage1_5,這些文件被稱爲stage1.5過程,這些文件每個至少都在11k以上。除此之外還有兩個比 較特殊的文件,分別爲nbgrub和pxegrub,這兩個文件主要是在網絡引導時使用,只是格式不同而已,他們很類似與stage2,只是需要建立網絡 來獲取配置文件。

由於stage1.5過程中會涉及到多個文件系統對應的文件,因此本文中主要以ext2fs爲例進行說明,其他文件系統與此類似,可以同樣進行分析理解。

對於ext2fs文件系統,用於生成該文件系統的stage1.5過程文件(e2fs_stage1_5)的代碼爲stage2/fsys_ext2fs.c文件。

stage2/filesys.h文件中定義了每個文件系統對外的接口,用於上層調用,作爲stage2過程尋找核心代碼使用,文件系統一般被定義的接口主要就是三個函數,分別是mount、read和dir函數。對應ext2fs,其定義的函數爲:

12345678
#ifdef FSYS_EXT2FS#define FSYS_EXT2FS_NUM 1int ext2fs_mount (void);int ext2fs_read (char *buf, int len);int ext2fs_dir (char *dirname);#else#define FSYS_EXT2FS_NUM 0#endif


針對ext2fs有如上的函數名稱,每個函數將具體在stage2/fsys_ext2fs.c文件中被定義,這裏面沒 有包含任何的寫的過程,對於bootloader而言僅僅讀就可以完成任務了,沒必要對其系統進行寫操作。其中ext2fs_mount函數用於檢查文件 系統類型,並將superblock讀入到內存中;ext2fs_read函數和ext2fs_dir函數用於對文件系統具體的操作。在stage2/fsys_ext2fs.c文件中除了需要對這三個函數的定義之外,還需要文件系統的屬性的數據結構(superblock、inode和group結構,這些結構最初被定義在include/linux/ext2_fs.h文件中),通過這些數據結構描述一個文件系統。

如果讀者有興趣可以試着創建新的文件系統的支持,可以參照目前存在的一些文件系統的模板(實例)編寫。

4.2 GRUB中stage2過程

GRUB中的核心過程也就是stage2過程了,該過程主要是在文件系統建立以後選擇合適的操作系統進行加載並轉交控制權,達到最後引導操作系統的 目標。由於GRUB屬於multi boot loader,因此在引導的時候要進行選擇,選擇哪種操作系統來運行。在GRUB內部主要包括兩種方式,首先是從menu.list中讀取顯示到屏幕讓用 戶選擇,其次是通過grub-shell中定義的命令手動進行啓動。本文將在後面介紹這兩種方式如何運行,接下來先介紹一下stage2的具體的執行過 程。

在上面一節中介紹過,stage1.5過程中將boot分區的文件系統加載了,之後又做了一件事情,就是將控制權轉交給stage2,而stage2入口的地方就是stage2/asm.S文件。Stage2/asm.S文件屬於彙編代碼,主要作用是初始化C語言的運行環境,爲下面執行C語言的函數做好準備,在準備好之後,將執行init_bios_info(stage2/common.c)函數。init_bios_info函數的作用是執行一些底層的函數,然後跳轉到cmain執行,cmain函數位於stage2/stage2.c文 件中。cmain函數內部進行一個死循環,在循環內部首先加載配置文件,顯示給用戶,在這同時循環一個內層循環,在內層循環中,獲取配置文件中的命令,並 解析執行。過程中如果沒有可用的配置文件,那麼進入命令行模式(enter_cmdline函數),如果找到可用的menu,那麼開始執行menu的對應 的內容(run_menu函數)。

對於enter_cmdline(stage2/stage2.c)函數,將調用find_command(stage2/cmdline.c),進而執行相應命令的函數。

對於run_menu(stage2/stage2.c)函數,將調用stage2/cmdline.c文件中的run_script函數,進而調用find_command,執行相應命令的函數。

這兩種方式雖然經過了不同的過程,對用戶輸入的行爲進行分析和處理,最終調用的函數爲find_command,在該函數中順序循環比較“輸入”的 命令是否與系統內部定義的相同,如果相同轉到執行該函數。在這個比較的過程中包含了一個全局的數據結構爲struct builtin(stage2/shared.h),由該數據結構組成了一個table類型(stage2/builtins.c),將命令與相對應的builtin結構對應一起並進行串聯。下面描述一下builtin結構的定義:

1234567891011121314
struct builtin {  /* 命令名稱,重要,是搜索命令時的依據*/  char *name;  /* 命令函數,重要,是搜索匹配後調用的函數*/  int (*func) (char *, int);  /* 功能標示,一般未用到. */  int flags;  /* 簡短幫助信息*/  char *short_doc;  /* 完整幫助信息*/  char *long_doc;};struct builtin *builtin_table[];

有興趣的讀者可以對上面的內容進行擴展,形成自己的命令,主要在stage2/builtins.c文件中按照預定的格式更新,並添加到builtin_table中即可。

在上面打開配置文件的過程中,主要是通過一些文件操作函數(被定義在stage2/disk_io.c中)完成。這些文 件操作函數主要包括:grub_open、grub_read、grub_seek和grub_close等,這些函數屬於grub對外的上層接口,具體 的函數內部將調用前文中提到的boot分區對應的文件系統的相應的函數完成,這個過程主要是通過回調函數來完成。該過程整體思路類似於面向對象過程,通過 對象操作具體的函數。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章