kmalloc函數詳解

kmalloc 函數詳解

#include <Linux/slab.h> void *kmalloc(size_t size, int flags);

給 kmalloc 的第一個參數是要分配的塊的大小. 第 2 個參數, 分配標誌, 非常有趣, 因爲它以幾個方式控制 kmalloc 的行爲.

最一般使用的標誌, GFP_KERNEL, 意思是這個分配((內部最終通過調用 __get_free_pages 來進行, 它是 GFP_ 前綴的來源) 代表運行在內核空間的進程而進行的. 換句話說, 這意味着調用函數是代表一個進程在執行一個系統調用. 使用 GFP_KENRL 意味着 kmalloc 能夠使當前進程在少內存的情況下睡眠來等待一頁. 一個使用 GFP_KERNEL 來分配內存的函數必須, 因此, 是可重入的並且不能在原子上下文中運行. 噹噹前進程睡眠, 內核採取正確的動作來定位一些空閒內存, 或者通過刷新緩存到磁盤或者交換出去一個用戶進程的內存.

GFP_KERNEL 不一直是使用的正確分配標誌; 有時 kmalloc 從一個進程的上下文的外部調用. 例如, 這類的調用可能發生在中斷處理, tasklet, 和內核定時器中. 在這個情況下, 當前進程不應當被置爲睡眠, 並且驅動應當使用一個 GFP_ATOMIC 標誌來代替. 內核正常地試圖保持一些空閒頁以便來滿足原子的分配. 當使用 GFP_ATOMIC 時, kmalloc 能夠使用甚至最後一個空閒頁. 如果這最後一個空閒頁不存在, 但是, 分配失敗.

其他用來代替或者增添 GFP_KERNEL 和 GFP_ATOMIC 的標誌, 儘管它們 2 個涵蓋大部分設備驅動的需要. 所有的標誌定義在 <linux/gfp.h>, 並且每個標誌用一個雙下劃線做前綴, 例如 __GFP_DMA. 另外, 有符號代表常常使用的標誌組合; 這些缺乏前綴並且有時被稱爲分配優先級. 後者包括:

GFP_ATOMIC
用來從中斷處理和進程上下文之外的其他代碼中分配內存. 從不睡眠.

GFP_KERNEL
內核內存的正常分配. 可能睡眠.

GFP_USER
用來爲用戶空間頁來分配內存; 它可能睡眠.

GFP_HIGHUSER
如同 GFP_USER, 但是從高端內存分配, 如果有. 高端內存在下一個子節描述.

GFP_NOIO
GFP_NOFS
這個標誌功能如同 GFP_KERNEL, 但是它們增加限制到內核能做的來滿足請求. 一個 GFP_NOFS 分配不允許進行任何文件系統調用, 而 GFP_NOIO 根本不允許任何 I/O 初始化. 它們主要地用在文件系統和虛擬內存代碼, 那裏允許一個分配睡眠, 但是遞歸的文件系統調用會是一個壞注意.

上面列出的這些分配標誌可以是下列標誌的相或來作爲參數, 這些標誌改變這些分配如何進行:

__GFP_DMA
這個標誌要求分配在能夠 DMA 的內存區. 確切的含義是平臺依賴的並且在下面章節來解釋.

__GFP_HIGHMEM
這個標誌指示分配的內存可以位於高端內存.

__GFP_COLD
正常地, 內存分配器盡力返回"緩衝熱"的頁 -- 可能在處理器緩衝中找到的頁. 相反, 這個標誌請求一個"冷"頁, 它在一段時間沒被使用. 它對分配頁作 DMA 讀是有用的, 此時在處理器緩衝中出現是無用的.

__GFP_NOWARN
這個很少用到的標誌阻止內核來發出警告(使用 printk ), 當一個分配無法滿足.

__GFP_HIGH
這個標誌標識了一個高優先級請求, 它被允許來消耗甚至被內核保留給緊急狀況的最後的內存頁.

__GFP_REPEAT
__GFP_NOFAIL
__GFP_NORETRY
這些標誌修改分配器如何動作, 當它有困難滿足一個分配. __GFP_REPEAT 意思是" 更盡力些嘗試" 通過重複嘗試 -- 但是分配可能仍然失敗. __GFP_NOFAIL 標誌告訴分配器不要失敗; 它盡最大努力來滿足要求. 使用 __GFP_NOFAIL 是強烈不推薦的; 可能從不會有有效的理由在一個設備驅動中使用它. 最後, __GFP_NORETRY 告知分配器立即放棄如果得不到請求的內存.

kmalloc 能夠分配的內存塊的大小有一個上限. 這個限制隨着體系和內核配置選項而變化. 如果你的代碼是要完全可移植, 它不能指望可以分配任何大於 128 KB. 如果你需要多於幾個 KB

這方面的原因:
kmalloc並不直接從分頁機制中獲得空閒頁面而是從slab頁面分配器那兒獲得需要的頁面,slab的實現代碼限制了最大分配的大小爲128k,即131072bytes,理論上你可以通過更改slab.c中的 cache_sizes數組中的最大值使得kmalloc可以獲得更大的頁面數,不知道有沒有甚麼副效應或者沒有必要這樣做,因爲獲取較大內存的方法有很多,想必128k是經驗總結後的合適值。

alloc_page( )可以分配的最大連續頁面是4K
 static inline struct page * alloc_pages(unsigned int gfp_mask, unsigned int order) 

/* 
 * Gets optimized away by the compiler. 
 */ 
 if (order >= MAX_ORDER) 
 return NULL; 
 return _alloc_pages(gfp_mask, order); 
 } 

alloc_pages最大分配頁面數爲512個,則可用內存數最大爲2^9*4K=2M
  
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章