用kzalloc申請內存的時候, 效果等同於先是用 kmalloc() 申請空間 , 然後用 memset() 來初始化 ,所有申請的元素都被初始化爲 0.
- /**
- * kzalloc - allocate memory. The memory is set to zero.
- * @size: how many bytes of memory are required.
- * @flags: the type of memory to allocate (see kmalloc).
- */
- static inline void *kzalloc(size_t size, gfp_t flags)
- {
- return kmalloc(size, flags | __GFP_ZERO);
- }
kzalloc 函數是帶參數調用kmalloc函數,添加的參數是或了標誌位__GFP_ZERO,
- void *__kmalloc(size_t size, gfp_t flags)
- {
- struct kmem_cache *s;
- void *ret;
- if (unlikely(size > SLUB_MAX_SIZE))
- return kmalloc_large(size, flags);
- s = get_slab(size, flags);
- if (unlikely(ZERO_OR_NULL_PTR(s)))
- return s;
- ret = slab_alloc(s, flags, -1, _RET_IP_);
- trace_kmalloc(_RET_IP_, ret, size, s->size, flags);
- return ret;
- }
這個函數調用trace_kmalloc,flags參數不變,繼續往裏面可以看到
- static __always_inline void *slab_alloc(struct kmem_cache *s,
- gfp_t gfpflags, int node, unsigned long addr)
- {
- void **object;
- struct kmem_cache_cpu *c;
- unsigned long flags;
- unsigned int objsize;
- gfpflags &= gfp_allowed_mask;
- lockdep_trace_alloc(gfpflags);
- might_sleep_if(gfpflags & __GFP_WAIT);
- if (should_failslab(s->objsize, gfpflags))
- return NULL;
- local_irq_save(flags);
- c = get_cpu_slab(s, smp_processor_id());
- objsize = c->objsize;
- if (unlikely(!c->freelist || !node_match(c, node)))
- object = __slab_alloc(s, gfpflags, node, addr, c);
- else {
- object = c->freelist;
- c->freelist = object[c->offset];
- stat(c, ALLOC_FASTPATH);
- }
- local_irq_restore(flags);
- if (unlikely((gfpflags & __GFP_ZERO) && object))
- memset(object, 0, objsize);
- kmemcheck_slab_alloc(s, gfpflags, object, c->objsize);
- kmemleak_alloc_recursive(object, objsize, 1, s->flags, gfpflags);
- return object;
- }
這裏主要判斷兩個標誌,WAIT和ZERO,和本文有關的關鍵代碼就是
- if (unlikely((gfpflags & __GFP_ZERO) && object)) memset(object, 0, objsize);
到此,這個函數區別於kmalloc的地方就清楚了
kmalloc 函數詳解
#include <linux/slab.h> void *kmalloc(size_t size, int flags);
給 kmalloc 的第一個參數是要分配的塊的大小. 第 2 個參數, 分配標誌, 非常有趣, 因爲它以幾個方式控制 kmalloc 的行爲.
最一般使用的標誌, GFP_KERNEL, 意思是這個分配((內部最終通過調用 __get_free_pages 來進行, 它是 GFP_ 前綴的來源) 代表運行在內核空間的進程而進行的. 換句話說, 這意味着調用函數是代表一個進程在執行一個系統調用. 使用 GFP_KENRL 意味着 kmalloc 能夠使當前進程在少內存的情況下睡眠來等待一頁. 一個使用 GFP_KERNEL 來分配內存的函數必須, 因此, 是可重入的並且不能在原子上下文中運行. 噹噹前進程睡眠, 內核採取正確的動作來定位一些空閒內存, 或者通過刷新緩存到磁盤或者交換出去一個用戶進程的內存.
GFP_KERNEL 不一直是使用的正確分配標誌; 有時 kmalloc 從一個進程的上下文的外部調用. 例如, 這類的調用可能發生在中斷處理, tasklet, 和內核定時器中. 在這個情況下, 當前進程不應當被置爲睡眠, 並且驅動應當使用一個 GFP_ATOMIC 標誌來代替. 內核正常地試圖保持一些空閒頁以便來滿足原子的分配. 當使用 GFP_ATOMIC 時, kmalloc 能夠使用甚至最後一個空閒頁. 如果這最後一個空閒頁不存在, 但是, 分配失敗.
其他用來代替或者增添 GFP_KERNEL 和 GFP_ATOMIC 的標誌, 儘管它們 2 個涵蓋大部分設備驅動的需要. 所有的標誌定義在 <linux/gfp.h>, 並且每個標誌用一個雙下劃線做前綴, 例如 __GFP_DMA. 另外, 有符號代表常常使用的標誌組合; 這些缺乏前綴並且有時被稱爲分配優先級. 後者包括:
- GFP_ATOMIC
-
用來從中斷處理和進程上下文之外的其他代碼中分配內存. 從不睡眠.
- GFP_KERNEL
-
內核內存的正常分配. 可能睡眠.
- GFP_USER
-
用來爲用戶空間頁來分配內存; 它可能睡眠.
- GFP_HIGHUSER
-
如同 GFP_USER, 但是從高端內存分配, 如果有. 高端內存在下一個子節描述.
- GFP_NOIO
- GFP_NOFS
- 這個標誌功能如同 GFP_KERNEL, 但是它們增加限制到內核能做的來滿足請求. 一個 GFP_NOFS 分配不允許進行任何文件系統調用, 而 GFP_NOIO 根本不允許任何 I/O 初始化. 它們主要地用在文件系統和虛擬內存代碼, 那裏允許一個分配睡眠, 但是遞歸的文件系統調用會是一個壞注意.
上面列出的這些分配標誌可以是下列標誌的相或來作爲參數, 這些標誌改變這些分配如何進行:
- __GFP_DMA
-
這個標誌要求分配在能夠 DMA 的內存區. 確切的含義是平臺依賴的並且在下面章節來解釋.
- __GFP_HIGHMEM
-
這個標誌指示分配的內存可以位於高端內存.
- __GFP_COLD
-
正常地, 內存分配器盡力返回"緩衝熱"的頁 -- 可能在處理器緩衝中找到的頁. 相反, 這個標誌請求一個"冷"頁, 它在一段時間沒被使用. 它對分配頁作 DMA 讀是有用的, 此時在處理器緩衝中出現是無用的.
- __GFP_NOWARN
-
這個很少用到的標誌阻止內核來發出警告(使用 printk ), 當一個分配無法滿足.
- __GFP_HIGH
-
這個標誌標識了一個高優先級請求, 它被允許來消耗甚至被內核保留給緊急狀況的最後的內存頁.
- __GFP_REPEAT
- __GFP_NOFAIL
- __GFP_NORETRY
-
這些標誌修改分配器如何動作, 當它有困難滿足一個分配. __GFP_REPEAT 意思是" 更盡力些嘗試" 通過重複嘗試 -- 但是分配可能仍然失敗. __GFP_NOFAIL 標誌告訴分配器不要失敗; 它盡最大努力來滿足要求. 使用 __GFP_NOFAIL 是強烈不推薦的; 可能從不會有有效的理由在一個設備驅動中使用它. 最後, __GFP_NORETRY 告知分配器立即放棄如果得不到請求的內存.
-
kmalloc 能夠分配的內存塊的大小有一個上限. 這個限制隨着體系和內核配置選項而變化. 如果你的代碼是要完全可移植, 它不能指望可以分配任何大於 128 KB. 如果你需要多於幾個 KB
- 這方面的原因:
- kmalloc並不直接從分頁機制中獲得空閒頁面而是從slab頁面分配器那兒獲得需要的頁面,slab的實現代碼限制了最大分配的大小爲128k,即131072bytes,理論上你可以通過更改slab.c中的 cache_sizes數組中的最大值使得kmalloc可以獲得更大的頁面數,不知道有沒有甚麼副效應或者沒有必要這樣做,因爲獲取較大內存的方法有很多,想必128k是經驗總結後的合適值。
- alloc_page( )可以分配的最大連續頁面是4K
- static inline struct page * alloc_pages(unsigned int gfp_mask, unsigned int order)
- {
- /*
- * Gets optimized away by the compiler.
- */
- if (order >= MAX_ORDER)
- return NULL;
- return _alloc_pages(gfp_mask, order);
- }
alloc_pages最大分配頁面數爲512個,則可用內存數最大爲2^9*4K=2M