linux內核簡介

Linux內核結構 

  


Linux內核主要由五個子系統組成:進程調度,內存管理,虛擬文件系統,網絡接口,進程間通信。

1.進程調度(SCHED):控制進程對CPU的訪問。當需要選擇下一個進程運行時,由調度程序選擇最值得運行的進程。可運行進程實際上是僅等待CPU資源的進程,如果某個進程在等待其它資源,則該進程是不可運行進程。Linux使用了比較簡單的基於優先級的進程調度算法選擇新的進程。

2.內存管理(MM)允許多個進程安全的共享主內存區域。Linux 的內存管理支持虛擬內存,即在計算機中運行的程序,其代碼,數據,堆棧的總量可以超過實際內存的大小,操作系統只是把當前使用的程序塊保留在內存中,其餘的程序塊則保留在磁盤中。必要時,操作系統負責在磁盤和內存間交換程序塊。內存管理從邏輯上分爲硬件無關部分和硬件有關部分。硬件無關部分提供了進程的映射和邏輯內存的對換;硬件相關的部分爲內存管理硬件提供了虛擬接口。

3.虛擬文件系統(Virtual File System,VFS)隱藏了各種硬件的具體細節,爲所有的設備提供了統一的接口,VFS提供了多達數十種不同的文件系統。虛擬文件系統可以分爲邏輯文件系統和設備驅動程序。邏輯文件系統指Linux所支持的文件系統,如ext2,fat等,設備驅動程序指爲每一種硬件控制器所編寫的設備驅動程序模塊。

4.網絡接口(NET)提供了對各種網絡標準的存取和各種網絡硬件的支持。網絡接口可分爲網絡協議和網絡驅動程序。網絡協議部分負責實現每一種可能的網絡傳輸協議。網絡設備驅動程序負責與硬件設備通訊,每一種可能的硬件設備都有相應的設備驅動程序。

5.進程間通訊(IPC) 支持進程間各種通信機制。

 

處於中心位置的進程調度,所有其它的子系統都依賴它,因爲每個子系統都需要掛起或恢復進程。一般情況下,當一個進程等待硬件操作完成時,它被掛起;當操作真正完成時,進程被恢復執行。例如,當一個進程通過網絡發送一條消息時,網絡接口需要掛起發送進程,直到硬件成功成功地完成消息的發送,當消息被成功的發送出去以後,網絡接口給進程返回一個代碼,表示操作的成功或失敗。其他子系統以相似的理由依賴於進程調度。

各個子系統之間的依賴關係如下:

進程調度與內存管理之間的關係:這兩個子系統互相依賴。在多道程序環境下,程序要運行必須爲之創建進程,而創建進程的第一件事情,就是將程序和數據裝入內存。

進程間通信與內存管理的關係:進程間通信子系統要依賴內存管理支持共享內存通信機制,這種機制允許兩個進程除了擁有自己的私有空間,還可以存取共同的內存區域。

虛擬文件系統與網絡接口之間的關係:虛擬文件系統利用網絡接口支持網絡文件系統(NFS),也利用內存管理支持RAMDISK設備。

內存管理與虛擬文件系統之間的關係:內存管理利用虛擬文件系統支持交換,交換進程(swapd)定期由調度程序調度,這也是內存管理依賴於進程調度的唯一原因。當一個進程存取的內存映射被換出時,內存管理向文件系統發出請求,同時,掛起當前正在運行的進程。

除了這些依賴關係外,內核中的所有子系統還要依賴於一些共同的資源。這些資源包括所有子系統都用到的過程。例如:分配和釋放內存空間的過程,打印警告或錯誤信息的過程,還有系統的調試例程等等。

系統數據結構

在linux的內核的實現中,有一些數據結構使用頻度較高,他們是:

task_struct

Linux內核利用一個數據結構(task_struct)代表一個進程,代表進程的數據結構指針形成了一個task數組(Linux中,任務和進程是相同的術語),這種指針數組有時也稱爲指針向量。這個數組的大小由NR_TASKS(默認爲512),表明Linux系統中最多能同時運行的進程數目。當建立新進程的時候,Linux爲新進程分配一個task_struct結構,然後將指針保存在task數組中。調度程序一直維護着一個current指針,他指向當前正在運行的進程。

Mm_struct

每個進程的虛擬內存由一個mm_struct結構來代表,該結構實際上包含了當前執行映像的有關信息,並且包含了一組指向vm_area_struct結構的指針,vm_area_struct結構描述了虛擬內存的一個區域。

Inode

虛擬文件系統(VFS)中的文件、目錄等均由對應的索引節點(inode)代表。每個VFS索引節點中的內容由文件系統專屬的例程提供。VFS索引節點只存在於內核內存中,實際保存於VFS的索引節點高速緩存中。如果兩個進程用相同的進程打開,則可以共享inade的數據結構,這種共享是通過兩個進程中數據塊指向相同的inode完成。

Linux的具體結構

所謂具體結構是指系統實現的結構。

Linux的具體結構類似於抽象結構,這種對應性是因爲抽象結構來源於具體結構,我們的劃分沒有嚴格依照源代碼的目錄結構,且和子系統的分組也不完全匹配,但是,它很接近源代碼的目錄結構。

儘管前面的討論的抽象結構顯示了各個子系統之間只有很少的依賴關係,但是具體結構的5個子系統之間有高度的依賴關係。我們可以看出,具體結構中的很多依賴關係並沒有在抽象結構中出現。

Linux內核源代碼

目前,較新而又穩定的內核版本是2.0.x和2.2.x,因爲版本不同稍有差別,因此如果你想讓一個新的驅動程序既支持2.0.x,有支持2.2.x,就需要根據內核版本進行條件編譯,要作到這一點,就要支持宏LINUX_VERSION_CODE,假如內核的版本用a.b.c來表示,這個宏的值就是216a+28b+c。要用到指定內核版本的值,我們可以用KERNEL_VERSION宏,我們也可以自己去定義它。

對內核的修改用補丁文件的方式發佈的。Patch實用程序用來用來對內核源文件進行一系列的修該。例如:你有2.2.9的源代碼,但想移到2.2.10。就可以獲得2.2.10的補丁文件,應用patch來修改2.2.9源文件。例如:

$ cd /usr/src/linux

$ patch –pl < patch-2.2.10

 

Linux 內核源代碼的結構

Linux內核源代碼位於/usr/src/linux目錄下。

/include子目錄包含了建立內核代碼時所需的大部分包含文件,這個模塊利用其他模塊重建內核。

/init 子目錄包含了內核的初始化代碼,這是內核工作的開始的起點。

/arch子目錄包含了所有硬件結構特定的內核代碼。如:i386,alpha

/drivers子目錄包含了內核中所有的設備驅動程序,如塊設備和SCSI設備。

/fs子目錄包含了所有的文件系統的代碼。如:ext2,vfat等。

/net子目錄包含了內核的連網代碼。

/mm子目錄包含了所有內存管理代碼。

/ipc子目錄包含了進程間通信代碼。

/kernel子目錄包含了主內核代碼。

 

從何處開始閱讀源代碼?

在Internet,有人制作了源代碼導航器,爲閱讀源代碼提供了良好的條件,站點爲lxr.linux.no/source。

下面給出閱讀源代碼的線索。

系統的啓動和初始化:

在基於Intel的系統上,當loadlin.exe或LILO把內核裝入到內存並把控制權傳遞給內核時,內核開始啓動。關於這儀部分請看,arch/i386/kernel/head.S,head.S進行特定結構的設置,然後跳轉到init/main.c的main()例程。

內存管理:

內存管理的代碼主要在/mm,但是特定結構的代碼在arch/*/mm。缺頁中斷處理的代碼在/mm/memory.c ,而內存映射和頁高速緩存器的代碼在/mm/filemap.c 。緩衝器高速緩存是在/mm/buffer.c 中實現,而交換高速緩存是在mm/swap_state.c和mm/swapfile.c。

內核:

內核中,特定結構的代碼在arch/*/kernel,調度程序在kernel/sched.c,fork的代碼在kernel/fork.c,內核例程處理程序在include/linux/interrupt.h,task_struct數據結構在inlucde/linux/sched.h中。

PCI:

PCI僞驅動程序在drivers/pci/pci.c,其定義在inclulde/linux/pci.h。每一種結構都有一些特定的PCI BIOS代碼,Intel的在arch/alpha/kernel/bios32.c中。

進程間通信:

所有的System V IPC對象權限都包含在ipc_perm數據結構中,這可以在include/linux/ipc.h中找到。System V消息是在ipc/msg.c中實現。共享內存在ipc/shm.c中實現。信號量在ipc/sem.c中,管道在/ipc/pipe.c中實現。

中斷處理:內核的中斷處理代碼幾乎所有的微處理器特有的。中斷處理代碼在arch/i386/kernel/irq.c中,其定義在include/asm-i386/irq.h中。

jjgirl摘自《linux內核分析》一書 作者陳莉君
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章