現在讓我們從一個比較高的高度來審視一下 GNU/Linux 操作系統的體系結構。您可以從兩個層次上來考慮操作系統,如圖所示。
、
最上面是用戶(或應用程序)空間。這是用戶應用程序執行的地方。用戶空間之下是內核空間,Linux 內核正是位於這裏。
GNU C Library (glibc)也在這裏。它提供了連接內核的系統調用接口,還提供了在用戶空間應用程序和內核之間進行轉換的機制。這點非常重要,因爲內核和用戶空間的應用程序使用的是不同的保護地址空間。每個用戶空間的進程都使用自己的虛擬地址空間,而內核則佔用單獨的地址空間。 更多信息,請參看 參考資料 一節中的鏈接。
Linux 內核可以進一步劃分成 3 層。最上面是系統調用接口,它實現了一些基本的功能,例如 read
和 write
。系統調用接口之下是內核代碼,可以更精確地定義爲獨立於體系結構的內核代碼。這些代碼是 Linux 所支持的所有處理器體系結構所通用的。在這些代碼之下是依賴於體系結構的代碼,構成了通常稱爲 BSP(Board
Support Package)的部分。這些代碼用作給定體系結構的處理器和特定於平臺的代碼。
Linux內核的屬性
在討論大型而複雜的系統的體系結構時,可以從很多角度來審視系統。體系結構分析的一個目標是提供一種方法更好地理解源代碼,這正是本文的目的。
Linux 內核實現了很多重要的體系結構屬性。在或高或低的層次上,內核被劃分爲多個子系統。Linux 也可以看作是一個整體,因爲它會將所有這些基本服務都集成到內核中。這與微內核的體系結構不同,後者會提供一些基本的服務,例如通信、I/O、內存和進程管理,更具體的服務都是插入到微內核層中的。每種內核都有自己的優點,不過這裏並不對此進行討論。
隨着時間的流逝,Linux 內核在內存和 CPU 使用方面具有較高的效率,並且非常穩定。但是對於 Linux 來說,最爲有趣的是在這種大小和複雜性的前提下,依然具有良好的可移植性。Linux 編譯後可在大量處理器和具有不同體系結構約束和需求的平臺上運行。一個例子是 Linux 可以在一個具有內存管理單元(MMU)的處理器上運行,也可以在那些不提供 MMU 的處理器上運行。Linux 內核的 uClinux 移植提供了對非 MMU 的支持。更詳細信息請參看 參考資料 一節的內容。
Linux內核的主要子系統
Linux系統調用接口(SCI)
進程管理(PM)
進程管理的重點是進程的執行。在內核中,這些進程稱爲線程,代表了單獨的處理器虛擬化(線程代碼、數據、堆棧和 CPU 寄存器)。在用戶空間,通常使用進程 這個術語,不過 Linux 實現並沒有區分這兩個概念(進程和線程)。內核通過 SCI 提供了一個應用程序編程接口(API)來創建一個新進程(fork、exec 或 Portable Operating System Interface [POSIX] 函數),停止進程(kill、exit),並在它們之間進行通信和同步(signal 或者 POSIX 機制)。
進程管理還包括處理活動進程之間共享 CPU 的需求。內核實現了一種新型的調度算法,不管有多少個線程在競爭 CPU,這種算法都可以在固定時間內進行操作。這種算法就稱爲 O(1) 調度程序,這個名字就表示它調度多個線程所使用的時間和調度一個線程所使用的時間是相同的。 O(1) 調度程序也可以支持多處理器(稱爲對稱多處理器或 SMP)。您可以在 ./linux/kernel 中找到進程管理的源代碼,在 ./linux/arch 中可以找到依賴於體系結構的源代碼。在 參考資料 一節中可以瞭解有關這個算法的更多內容。
內存管理(MM)
內核所管理的另外一個重要資源是內存。爲了提高效率,如果由硬件管理虛擬內存,內存是按照所謂的內存頁 方式進行管理的(對於大部分體系結構來說都是 4KB)。Linux 包括了管理可用內存的方式,以及物理和虛擬映射所使用的硬件機制。
不過內存管理要管理的可不止 4KB 緩衝區。Linux 提供了對 4KB 緩衝區的抽象,例如 slab 分配器。這種內存管理模式使用 4KB 緩衝區爲基數,然後從中分配結構,並跟蹤內存頁使用情況,比如哪些內存頁是滿的,哪些頁面沒有完全使用,哪些頁面爲空。這樣就允許該模式根據系統需要來動態調整內存使用。
爲了支持多個用戶使用內存,有時會出現可用內存被消耗光的情況。由於這個原因,頁面可以移出內存並放入磁盤中。這個過程稱爲交換,因爲頁面會被從內存交換到硬盤上。內存管理的源代碼可以在 ./linux/mm 中找到。
虛擬文件系統
在 VFS 上面,是對諸如 open、close、read 和 write 之類的函數的一個通用 API 抽象。在 VFS 下面是文件系統抽象,它定義了上層函數的實現方式。它們是給定文件系統(超過 50 個)的插件。文件系統的源代碼可以在 ./linux/fs 中找到。
文件系統層之下是緩衝區緩存,它爲文件系統層提供了一個通用函數集(與具體文件系統無關)。這個緩存層通過將數據保留一段時間(或者隨即預先讀取數據以便在需要是就可用)優化了對物理設備的訪問。緩衝區緩存之下是設備驅動程序,它實現了特定物理設備的接口。
網絡堆棧
網絡堆棧在設計上遵循模擬協議本身的分層體系結構。回想一下,Internet Protocol (IP) 是傳輸協議(通常稱爲傳輸控制協議或 TCP)下面的核心網絡層協議。TCP 上面是 socket 層,它是通過 SCI 進行調用的。
socket 層是網絡子系統的標準 API,它爲各種網絡協議提供了一個用戶接口。從原始幀訪問到 IP 協議數據單元(PDU),再到 TCP 和 User Datagram Protocol (UDP),socket 層提供了一種標準化的方法來管理連接,並在各個終點之間移動數據。內核中網絡源代碼可以在 ./linux/net 中找到。
設備驅動程序
依賴體系結構的代碼
Linux內核的一些有用特性、
如果 Linux 內核的可移植性和效率還不夠好,Linux 還提供了其他一些特性,它們無法劃分到上面的分類中。
作爲一個生產操作系統和開源軟件,Linux 是測試新協議及其增強的良好平臺。Linux 支持大量網絡協議,包括典型的 TCP/IP,以及高速網絡的擴展(大於 1 Gigabit Ethernet [GbE] 和 10 GbE)。Linux 也可以支持諸如流控制傳輸協議(SCTP)之類的協議,它提供了很多比 TCP 更高級的特性(是傳輸層協議的接替者)。
Linux 還是一個動態內核,支持動態添加或刪除軟件組件。被稱爲動態可加載內核模塊,它們可以在引導時根據需要(當前特定設備需要這個模塊)或在任何時候由用戶插入。
Linux 最新的一個增強是可以用作其他操作系統的操作系統(稱爲系統管理程序)。最近,對內核進行了修改,稱爲基於內核的虛擬機(KVM)。這個修改爲用戶空間啓用了一個新的接口,它可以允許其他操作系統在啓用了 KVM 的內核之上運行。除了運行 Linux 的其他實例之外, Microsoft® Windows® 也可以進行虛擬化。惟一的限制是底層處理器必須支持新的虛擬化指令。更多信息請參看參考資料 一節的內容。
參考文獻:
-
您可以參閱本文在 developerWorks 全球站點上的 英文原文 。
-
GNU 站點 介紹了 GNU GPL,它涵蓋了 Linux 內核及其附帶的大量有用的應用程序。另外還介紹了一個比 GPL 限制更少的許可 Lesser GPL (LGPL)。
-
UNIX、 MINIX 和 Linux 在
Wikipedia 上都有介紹,另外還詳細介紹了操作系統系列。
-
GNU C Library,即 glibc,是標準 C 庫的實現。它用於 GNU/Linux 操作系統,也可用於 GNU/Hurd 微內核操作系統。
-
uClinux 是 Linux 內核的一個移植,它可以在一些缺少 MMU 的系統上執行。這允許 Linux 內核在很小的嵌入式平臺上運行,例如 PalmPilot PalmPilot Personal Digital Assistants (PDAs) 上使用的 Motorola DragonBall 處理器。
-
“使用 Linux 系統調用的內核命令”(developerWorks,2007 年 3 月)對 SCI 進行了介紹,這是 Linux 內核中非常重要的一層,具有 glibc 的用戶空間支持,可以在用戶空間和內核之間啓用函數調用。
-
“Linux 調度器內幕”(developerWorks,2006 年 6 月)介紹了 Linux 2.6 中引入的新 O(1) 調度程序,這是一個非常高效的算法,可以擴展到很大數量的進程(線程),並且可以利用 SMP 系統。
-
“使用 /proc 文件系統來訪問 Linux 內核的內容”(developerWorks,2006 年 3 月)介紹了 /proc 文件系統,這是一個虛擬文件系統,爲用戶空間的應用程序提供了一種全新的方法與內核進行通信。這篇文章展示了 /proc 以及可加載內核模塊。
-
“服務器診所: 使虛擬文件系統工作”(developerWorks,2003 年 4 月)深入介紹了 VFS 層,它允許 Linux 通過一個通用接口支持各種不同的文件系統。這個相同的接口也可以用於其他類型的設備,例如 socket。
-
“Linux 引導過程內幕”(developerWorks,2006 年 5 月)介紹了 Linux 的引導過程,該過程將啓動一個 Linux 系統,並且不管是從硬盤、軟盤、USB 內存條還是通過網絡引導系統,該過程是相同的。
-
“Linux 初始 RAM 磁盤(initrd)概述”(developerWorks,2006 年 7 月)介紹了初始 RAM 磁盤,它將引導過程與所引導的物理介質隔離開來。
-
“使用 SCTP 優化網絡”(developerWorks,2006 年 2 月)介紹了一種非常有用的網絡協議:流控制傳輸協議,它的操作與 TCP 類似,但是增加了很多有用的特性,例如消息傳遞、 多宿主和多流。如果您對網絡協議感興趣,那麼 Linux 與 BSD 一樣,都是一種非常好的操作系統。
-
“Linux slab 分配器詳解” (developerWorks,2007 年 5 月)介紹了 Linux 內存管理中最有用的一個工具:slab 分配器。這種機制源自於 SunOS,不過它在 Linux 內核中找到了合適的位置。
-
“虛擬 Linux”(developerWorks,2006 年 12 月)介紹了 Linux 是如何充分利用具有虛擬化能力的處理器。
-
“Linux 和對稱多處理”(developerWorks,2007 年 3 月)討論了 Linux 怎樣利用提供芯片級多處理能力的芯片。
-
“探索 Linux 內核虛擬機”(developerWorks,2007 年 4 月)介紹了最近引入內核的虛擬化技術,它可以將 Linux 內核轉換成其他虛擬化的操作系統的系統管理程序。
-
有關在用戶空間對 Linux 進行編程的更多信息,請參考 Tim 撰寫的 GNU/Linux Application Programming 一書。
-
在 developerWorks Linux 專區 中可找到適合 Linux 開發人員的更多資源,包括 Linux 教程 以及上月 讀者最喜歡的
Linux 文章和教程。