linux內核內存管理(zone_dma zone_normal zone_highmem)

Linux 操作系統和驅動程序運行在內核空間,應用程序運行在用戶空間,兩者不能簡單地使用指針傳遞數據,因爲Linux使用的虛擬內存機制,用戶空間的數據可能被換出,當內核空間使用用戶空間指針時,對應的數據可能不在內存中。

 

   Linux內核地址空間劃分

通常32位Linux內核地址空間劃分0~3G爲用戶空間,3~4G爲內核空間。注意這裏是32位內核地址空間劃分,64位內核地址空間劃分是不同的。

1、x86的物理地址空間佈局:

 

 

 物理地址空間的頂部以下一段空間,被PCI設備的I/O內存映射佔據,它們的大小和佈局由PCI規範所決定。640K~1M這段地址空間被BIOS和VGA適配器所佔據。

  Linux系統在初始化時,會根據實際的物理內存的大小,爲每個物理頁面創建一個page對象,所有的page對象構成一個mem_map數組。

進一步,針對不同的用途,Linux內核將所有的物理頁面劃分到3類內存管理區中,如圖,分別爲ZONE_DMA,ZONE_NORMAL,ZONE_HIGHMEM。

  ZONE_DMA的範圍是0~16M,該區域的物理頁面專門供I/O設備的DMA使用。之所以需要單獨管理DMA的物理頁面,是因爲DMA使用物理地址訪問內存,不經過MMU,並且需要連續的緩衝區,所以爲了能夠提供物理上連續的緩衝區,必須從物理地址空間專門劃分一段區域用於DMA。

  ZONE_NORMAL的範圍是16M~896M,該區域的物理頁面是內核能夠直接使用的。

  ZONE_HIGHMEM的範圍是896M~結束,該區域即爲高端內存,內核不能直接使用。

 

2、linux虛擬地址內核空間分佈

 

 

在kernel image下面有16M的內核空間用於DMA操作。位於內核空間高端的128M地址主要由3部分組成,分別爲vmalloc area,持久化內核映射區,臨時內核映射區。

  由於ZONE_NORMAL和內核線性空間存在直接映射關係,所以內核會將頻繁使用的數據如kernel代碼、GDT、IDT、PGD、mem_map數組等放在ZONE_NORMAL裏。而將用戶數據、頁表(PT)等不常用數據放在ZONE_ HIGHMEM裏,只在要訪問這些數據時才建立映射關係(kmap())。比如,當內核要訪問I/O設備存儲空間時,就使用ioremap()將位於物理地址高端的mmio區內存映射到內核空間的vmalloc area中,在使用完之後便斷開映射關係。

 

3、linux虛擬地址用戶空間分佈

 

 用戶進程的代碼區一般從虛擬地址空間的0x08048000開始,這是爲了便於檢查空指針。代碼區之上便是數據區,未初始化數據區,堆區,棧區,以及參數、全局環境變量。

4、linux虛擬地址與物理地址映射的關係

 

Linux將4G的線性地址空間分爲2部分,0~3G爲user space,3G~4G爲kernel space。

  由於開啓了分頁機制,內核想要訪問物理地址空間的話,必須先建立映射關係,然後通過虛擬地址來訪問。爲了能夠訪問所有的物理地址空間,就要將全部物理地址空間映射到1G的內核線性空間中,這顯然不可能。於是,內核將0~896M的物理地址空間一對一映射到自己的線性地址空間中,這樣它便可以隨時訪問ZONE_DMA和ZONE_NORMAL裏的物理頁面;此時內核剩下的128M線性地址空間不足以完全映射所有的ZONE_HIGHMEM,Linux採取了動態映射的方法,即按需的將ZONE_HIGHMEM裏的物理頁面映射到kernel space的最後128M線性地址空間裏,使用完之後釋放映射關係,以供其它物理頁面映射。雖然這樣存在效率的問題,但是內核畢竟可以正常的訪問所有的物理地址空間了。

 

5、buddyinfo的理解

cat /proc/buddyinfo 顯示如下:

Node 0, zone      DMA       0      4      5      4      4      3 ...

Node 0, zone   Normal      1      0      0      1    101     8 ...

Node 0, zone  HighMem    2      0      0      1      1       0 ...

其中,Node表示在NUMA環境下的節點號,這裏只有一個節點0;zone表示每一個節點下的區域,一般有DMA、Normal和HignMem三個區域;後面的列表示,夥伴系統中每一個order對應的空閒頁面塊。例如,對於zone DMA的第二列(從0開始算起),空閒頁面數爲5*2^4,可用內存爲5*2^4*PAGE_SIZE。

 

計算方法就是:

                     當前列的數字*2^列數*PAGE_SIZE 其中列數是從0開始計算的,即第一列是 當前列的數字*2^0*PAGE_SIZE

 

常見問題:

1、用戶空間(進程)是否有高端內存概念?

用戶進程沒有高端內存概念。只有在內核空間才存在高端內存。用戶進程最多只可以訪問3G物理內存,而內核進程可以訪問所有物理內存。

2、64位內核中有高端內存嗎?

目前現實中,64位Linux內核不存在高端內存,因爲64位內核可以支持超過512GB內存。若機器安裝的物理內存超過內核地址空間範圍,就會存在高端內存。

3、用戶進程能訪問多少物理內存?內核代碼能訪問多少物理內存?

32位系統用戶進程最大可以訪問3GB,內核代碼可以訪問所有物理內存。

64位系統用戶進程最大可以訪問超過512GB,內核代碼可以訪問所有物理內存。

 

4、高端內存和物理地址、邏輯地址、線性地址的關係?

高端內存只和邏輯地址有關係,和邏輯地址、物理地址沒有直接關係。

 

5、爲什麼不把所有的地址空間都分配給內核?

若把所有地址空間都給內存,那麼用戶進程怎麼使用內存?怎麼保證內核使用內存和用戶進程不起衝突?

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章