物理內存和線性空間(虛擬內存)

在硬件工程師和普通用戶看來,內存就是插在或固化在主板上的內存條,它們有一定的容量——比如64 MB。但在應用程序員眼中,並不過度關心插在主板上的內存容量,而是他們可以使用的內存空間——他們可以開發一個需要佔用1 GB內存的程序,並讓其在OS平臺上運行,哪怕這臺運行主機上只有128 MB的物理內存條。而對於OS開發者而言,則是介於二者之間,他們既需要知道物理內存的細節,也需要提供一套機制,爲應用程序員提供另一個內存空間,這個內存空間的大小可以和實際的物理內存大小之間沒有任何關係。 
   
  我們將主板上的物理內存條所提供的內存空間定義爲物理內存空間;將應用程序員看到的內存空間定義爲線性空間。物理內存空間大小在不同的主機上可以是不一樣的,隨着主板上所插的物理內存條的容量不同而不同;但爲應用程序員提供的線性空間卻是固定的,不會隨物理內存的變化而變化,這樣才能保證應用程序的可移植性。儘管物理內存的大小可以影響應用程序運行的性能,並且很多情況下對物理內存的大小有一個最低要求,但這些因素只是爲了讓一個OS可以正常的運行。 
   
  線性空間的大小在32-bit平臺上爲4 GB的固定大小,對於每個進程都是這樣(一個應用可以是多進程的,在OS眼中,是以進程爲單位的)。也就是說線性空間不是進程共享的,而是進程隔離的,每個進程都有相同大小的4 GB線性空間。一個進程對於某一個內存地址的訪問,與其它進程對於同一內存地址的訪問絕不衝突。比如,一個進程讀取線性空間地址1234ABCDh可以讀出整數8,而另外一個進程讀取線性空間地址1234ABCDh可以讀出整數20,這取決於進程自身的邏輯。 
   
  在任意一個時刻,在一個CPU上只有一個進程在運行。所以對於此CPU來講,在這一時刻,整個系統只存在一個線性空間,這個線性空間是面向此進程的。當進程發生切換的時候,線性空間也隨着切換。所以結論就是每個進程都有自己的線性空間,只有此進程運行的時候,其線性空間才被運行它的CPU所知。在其它時刻,其線性空間對於CPU來說,是不可知的。所以儘管每個進程都可以有4 GB的線性空間,但在CPU眼中,只有一個線性空間的存在。線性空間的變化,隨着進程切換而變化。 
   
  儘管線性空間的大小和物理內存的大小之間沒有任何關係,但使用線性空間的應用程序最終還是要運行在物理內存中。應用所給出的任何線性地址最終必須被轉化爲物理地址,才能夠真正的訪問物理內存。所以,線性內存空間必須被映射到物理內存空間中,這個映射關係需要通過使用硬件體系結構所規定的數據結構來建立。我們不妨先稱其爲映射表。一個映射表的內容就是某個線性內存空間和物理內存空間之間的映射關係。OS Kernel一旦告訴某個CPU一個映射表的位置,那麼這個CPU需要去訪問一個線性空間地址時,就根據這張映射表的內容,將這個線性空間地址轉化爲物理空間地址,並將此物理地址送到地址線,畢竟地址線只知道物理地址。 
   
  所以,我們很容易得出一個結論,如果我們給出不同的映射表,那麼CPU將某一線性空間地址轉化的物理地址也會不同。所以我們爲每一個進程都建立一張映射表,將每個進程的線性空間根據自己的需要映射到物理空間上。既然某一時刻在某一CPU上只能有一個應用在運行,那麼當任務發生切換的時候,將映射表也更換爲響應的映射表就可以實現每個進程都有自己的線性空間而互不影響。所以,在任意時刻,對於一個CPU來說,也只需要有一張映射表,以實現當前進程的線性空間到物理空間的轉化。 
   
  -------------------------------------------------------------------------------- 
   
   
   
  2. OS Kernel Space & Process Space 
   
   
  由於OS Kernel在任意時刻都必須存在於內存中,而進程卻可以切換,所以在任意時刻,內存中都存在兩部分,OS Kernel和用戶進程。而在任意時刻,對於一個CPU來說只存在一個線性空間,所以這個線性空間必須被分成兩部分,一部分供OS Kernel使用,另一部分供用戶進程使用。既然OS Kernel在任何時候都佔用線性空間中的一部分,那麼對於所有進程的線性空間而言,它們爲OS Kernel所留出的線性空間可以是完全相同的,也就是說,它們各自的映射表中,也分爲兩部分,一部分是進程私有映射部分,對於OS Kernel映射部分的內容則完全相同。 
   
  從這個意義上來說,我們可以認爲,對於所有的進程而言,它們共享OS Kernel所佔用的線性空間部分,而每個進程又各自有自己私有的線性空間部分。假如,我們將任意一個4 GB線性空間分割爲1 GB的OS Kernel空間部分和3 GB的進程空間部分,那麼所有進程的4 GB線性空間中1 GB的OS Kernel空間是共享的,而剩餘的3 GB進程空間部分則是各個進程私有的。Linux就是這麼做的,而Windows NT則是讓OS Kernel和進程各使用2 GB線性空間。 
   
  -------------------------------------------------------------------------------- 
   
   
   
  3. Segment Mapping & Page Mapping 
   
   
  所有的線性空間的內容只有被放置到物理內存中才能夠被真正的運行和操作。所以,儘管OS Kernel和進程都被放在線性空間中,但它們最終必須被放置到物理內存中。所以OS Kernel和所有的進程都最終共享物理內存。在現階段,物理內存遠沒有線性空間那麼大——線性空間是4 GB,而物理內存空間往往只有幾百兆,甚至更小。另外即使物理內存有4 GB,但由於每個進程都可以有3 GB線性空間(假如進程私有線性空間是3 GB的話),如果把所有進程的線性空間內容都放在物理內存中,明顯是不現實的。所以OS Kernel必須將某些進程暫時用不到的數據或代碼放在物理內存之外,將有限的內存提供給當前最需要的進程。另外,由於OS Kernel在任何時候都有可能運行,所以OS Kernel最好被永遠放在物理內存中。我們僅僅將進程數據進行換入換出。 
   
  從線性空間到物理空間的映射需要映射表,映射表的內容是將某段線性空間映射到相同大小的物理內存空間上。從理論上,我們可以使用兩種映射方法:變長映射,和定長映射。變長映射指的是根據不同的需要,將一個一個變長段映射到物理內存上,其格式可以如下(線性空間段起始地址,物理空間段起始地址,段長度)。假如一個進程有3個段:10M的數據段,5M的代碼段,和8K的堆棧段,那麼就可以在映射表中建立3項內容,每一項針對一個段。這看起來沒有問題。但假如現在我們的實際的內存只有32M,其中10M被內核佔用,留給進程的物理空間只有22M,那麼此進程在運行時,就佔據了10M+5M+8K的內存空間。隨後當進程發生切換時,假如另一個進程和其有相同的內存要求,那麼剩餘的22M-(10M+5M+8K)明顯就不夠用了,這時只能將原進程的某些段換出,並且必須是整段的換出。這就意味着我們必須至少換出一個10M的數據段,而換出的成本很高,因爲我們必須將這10M的內容拷貝到磁盤上,磁盤I/O是很慢的。 
   
  所以,使用變長的段映射的結果就是一個段要麼被全部換入,要麼被全部換出。但在現實中,一個程序中並非所有的代碼和數據都能夠被經常訪問,往往被經常訪問的只佔全部代碼數據的一部分,甚至是一小部分。所以更有效的策略是我們最好只換出那些並不經常使用的部分,而保留那些經常被使用的部分。而不是整個段的換入換出。這樣可以避免大塊的慢速磁盤操作。 
   
  這就是定長映射策略,我們將內存空間分割爲一個個定長塊,每個定長塊被稱爲一個頁。映射表的基本格式爲(物理空間頁起始地址),由於頁是定長的,所以不需要指出它的長度,另外,我們不需要在映射表中指定線性地址,我們可以將線性地址作爲索引,到映射表中檢索出相應的物理地址。當使用頁時,其策略爲:當換出的時候,我們只將那些不活躍的,也就是不經常使用的頁換出,而保留那些活躍的頁。在換入的時候,只有被請求訪問的頁才被換入,沒有被請求訪問的頁將永遠不會被換入到物理內存。這就是請求頁(Demand Page)算法的核心思想。 
   
  這就引出一個頁大小的問題:首先我們不可能以字節爲單位,這樣映射表的大小和線性空間大小相同——假如整個線性空間都被映射的話——我們不可能將全部線性空間用作存放這個映射表。由此,我們也可以得知,頁越小,則映射表的容量越大。而我們不能讓映射表佔用太多的空間。但如果頁太大,則面臨着和不定長段映射同樣的問題,每次換出一個頁,都需要大量的磁盤操作。另外,由於爲一個進程分配內存的最小單位是頁,假如我們的頁大小爲4 MB,那麼即使一個進程只需要使用4 KB的內存,也不得不佔用整個4 MB頁,這明顯是一種很大的浪費。所以我們必須在兩者之間進行折衷,一般平臺所規定的頁大小爲1 KB到8 KB,IA-32所規定的頁大小爲4 KB。(IA-32也支持4 MB頁,你可以根據你的OS的用途進行選擇,一般都是使用4 KB頁)。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章