kzalloc 函數詳解

 用kzalloc申請內存的時候, 效果等同於先是用 kmalloc() 申請空間 , 然後用 memset() 來初始化 ,所有申請的元素都被初始化爲 0.

  1. /**  
  2.  * kzalloc - allocate memory. The memory is set to zero.  
  3.  * @size: how many bytes of memory are required.  
  4.  * @flags: the type of memory to allocate (see kmalloc).  
  5.  */   
  6. static inline void *kzalloc(size_t size, gfp_t flags)   
  7. {   
  8.     return kmalloc(size, flags | __GFP_ZERO);   
  9. }   

kzalloc 函數是帶參數調用kmalloc函數,添加的參數是或了標誌位__GFP_ZERO,

 

  1. void *__kmalloc(size_t size, gfp_t flags) 
  2.     struct kmem_cache *s; 
  3.     void *ret; 
  4.  
  5.     if (unlikely(size > SLUB_MAX_SIZE)) 
  6.         return kmalloc_large(size, flags); 
  7.  
  8.     s = get_slab(size, flags); 
  9.  
  10.     if (unlikely(ZERO_OR_NULL_PTR(s))) 
  11.         return s; 
  12.  
  13.     ret = slab_alloc(s, flags, -1, _RET_IP_); 
  14.  
  15.     trace_kmalloc(_RET_IP_, ret, size, s->size, flags); 
  16.  
  17.     return ret; 

這個函數調用trace_kmalloc,flags參數不變,繼續往裏面可以看到

 

  1. static __always_inline void *slab_alloc(struct kmem_cache *s, 
  2.         gfp_t gfpflags, int node, unsigned long addr) 
  3.     void **object; 
  4.     struct kmem_cache_cpu *c; 
  5.     unsigned long flags; 
  6.     unsigned int objsize; 
  7.  
  8.     gfpflags &= gfp_allowed_mask; 
  9.  
  10.     lockdep_trace_alloc(gfpflags); 
  11.     might_sleep_if(gfpflags & __GFP_WAIT); 
  12.  
  13.     if (should_failslab(s->objsize, gfpflags)) 
  14.         return NULL; 
  15.  
  16.     local_irq_save(flags); 
  17.     c = get_cpu_slab(s, smp_processor_id()); 
  18.     objsize = c->objsize; 
  19.     if (unlikely(!c->freelist || !node_match(c, node))) 
  20.  
  21.         object = __slab_alloc(s, gfpflags, node, addr, c); 
  22.  
  23.     else { 
  24.         object = c->freelist; 
  25.         c->freelist = object[c->offset]; 
  26.         stat(c, ALLOC_FASTPATH); 
  27.     } 
  28.     local_irq_restore(flags); 
  29.  
  30.     if (unlikely((gfpflags & __GFP_ZERO) && object)) 
  31.         memset(object, 0, objsize); 
  32.  
  33.     kmemcheck_slab_alloc(s, gfpflags, object, c->objsize); 
  34.     kmemleak_alloc_recursive(object, objsize, 1, s->flags, gfpflags); 
  35.  
  36.     return object; 

這裏主要判斷兩個標誌,WAIT和ZERO,和本文有關的關鍵代碼就是

 

  1. if (unlikely((gfpflags & __GFP_ZERO) && object)) memset(object, 0, objsize); 

到此,這個函數區別於kmalloc的地方就清楚了

kmalloc 函數詳解

 

#include <linux/slab.h> void *kmalloc(size_t size, int flags);

 

給 kmalloc 的第一個參數是要分配的塊的大小. 第 2 個參數, 分配標誌, 非常有趣, 因爲它以幾個方式控制 kmalloc 的行爲.

 

 

最一般使用的標誌, GFP_KERNEL, 意思是這個分配((內部最終通過調用 __get_free_pages 來進行, 它是 GFP_ 前綴的來源) 代表運行在內核空間的進程而進行的. 換句話說, 這意味着調用函數是代表一個進程在執行一個系統調用. 使用 GFP_KENRL 意味着 kmalloc 能夠使當前進程在少內存的情況下睡眠來等待一頁. 一個使用 GFP_KERNEL 來分配內存的函數必須, 因此, 是可重入的並且不能在原子上下文中運行. 噹噹前進程睡眠, 內核採取正確的動作來定位一些空閒內存, 或者通過刷新緩存到磁盤或者交換出去一個用戶進程的內存.

 

 

GFP_KERNEL 不一直是使用的正確分配標誌; 有時 kmalloc 從一個進程的上下文的外部調用. 例如, 這類的調用可能發生在中斷處理, tasklet, 和內核定時器中. 在這個情況下, 當前進程不應當被置爲睡眠, 並且驅動應當使用一個 GFP_ATOMIC 標誌來代替. 內核正常地試圖保持一些空閒頁以便來滿足原子的分配. 當使用 GFP_ATOMIC 時, kmalloc 能夠使用甚至最後一個空閒頁. 如果這最後一個空閒頁不存在, 但是, 分配失敗.

 

 

其他用來代替或者增添 GFP_KERNEL 和 GFP_ATOMIC 的標誌, 儘管它們 2 個涵蓋大部分設備驅動的需要. 所有的標誌定義在 <linux/gfp.h>, 並且每個標誌用一個雙下劃線做前綴, 例如 __GFP_DMA. 另外, 有符號代表常常使用的標誌組合; 這些缺乏前綴並且有時被稱爲分配優先級. 後者包括:

 

 

GFP_ATOMIC
用來從中斷處理和進程上下文之外的其他代碼中分配內存. 從不睡眠.
 
GFP_KERNEL
內核內存的正常分配. 可能睡眠.
 
GFP_USER
用來爲用戶空間頁來分配內存; 它可能睡眠.
 
GFP_HIGHUSER
如同 GFP_USER, 但是從高端內存分配, 如果有. 高端內存在下一個子節描述.
 
GFP_NOIO
GFP_NOFS
這個標誌功能如同 GFP_KERNEL, 但是它們增加限制到內核能做的來滿足請求. 一個 GFP_NOFS 分配不允許進行任何文件系統調用, 而 GFP_NOIO 根本不允許任何 I/O 初始化. 它們主要地用在文件系統和虛擬內存代碼, 那裏允許一個分配睡眠, 但是遞歸的文件系統調用會是一個壞注意.

 

 

上面列出的這些分配標誌可以是下列標誌的相或來作爲參數, 這些標誌改變這些分配如何進行:

 

 

__GFP_DMA
這個標誌要求分配在能夠 DMA 的內存區. 確切的含義是平臺依賴的並且在下面章節來解釋.
 
__GFP_HIGHMEM
這個標誌指示分配的內存可以位於高端內存.
 
__GFP_COLD
正常地, 內存分配器盡力返回"緩衝熱"的頁 -- 可能在處理器緩衝中找到的頁. 相反, 這個標誌請求一個"冷"頁, 它在一段時間沒被使用. 它對分配頁作 DMA 讀是有用的, 此時在處理器緩衝中出現是無用的.
 
__GFP_NOWARN
這個很少用到的標誌阻止內核來發出警告(使用 printk ), 當一個分配無法滿足.
 
__GFP_HIGH
這個標誌標識了一個高優先級請求, 它被允許來消耗甚至被內核保留給緊急狀況的最後的內存頁.
 
__GFP_REPEAT
__GFP_NOFAIL
__GFP_NORETRY
這些標誌修改分配器如何動作, 當它有困難滿足一個分配. __GFP_REPEAT 意思是" 更盡力些嘗試" 通過重複嘗試 -- 但是分配可能仍然失敗. __GFP_NOFAIL 標誌告訴分配器不要失敗; 它盡最大努力來滿足要求. 使用 __GFP_NOFAIL 是強烈不推薦的; 可能從不會有有效的理由在一個設備驅動中使用它. 最後, __GFP_NORETRY 告知分配器立即放棄如果得不到請求的內存.
 
kmalloc 能夠分配的內存塊的大小有一個上限. 這個限制隨着體系和內核配置選項而變化. 如果你的代碼是要完全可移植, 它不能指望可以分配任何大於 128 KB. 如果你需要多於幾個 KB
 
這方面的原因:
kmalloc並不直接從分頁機制中獲得空閒頁面而是從slab頁面分配器那兒獲得需要的頁面,slab的實現代碼限制了最大分配的大小爲128k,即131072bytes,理論上你可以通過更改slab.c中的 cache_sizes數組中的最大值使得kmalloc可以獲得更大的頁面數,不知道有沒有甚麼副效應或者沒有必要這樣做,因爲獲取較大內存的方法有很多,想必128k是經驗總結後的合適值。
alloc_page( )可以分配的最大連續頁面是4K

  1.  static inline struct page * alloc_pages(unsigned int gfp_mask, unsigned int order)  
  2. {  
  3. /*  
  4.  * Gets optimized away by the compiler.  
  5.  */  
  6.  if (order >= MAX_ORDER)  
  7.  return NULL;  
  8.  return _alloc_pages(gfp_mask, order);  
  9.  }  

alloc_pages最大分配頁面數爲512個,則可用內存數最大爲2^9*4K=2M  

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章