1. 內核內存配置
AArch64 Linux通常使用以下配置:
- 4KB頁面, 使用3級或4級轉換表,支持39位(512GB)或48位(256TB)的虛擬地址。
- 64KB頁面,使用2級轉換表,支持42位(4TB)虛擬地址。
他們的內存佈局是一致的。
以內核defconfig默認的4KB page + 4 levels配置爲例,LINUX在arm架構上把虛擬地址空間劃分爲2個空間, 虛擬地址和內核地址, 每個空間最大支持256TB.
Start End Size Use
-----------------------------------------------------------------------
0x0000000000000_0000 0x0000_ffff_ffff_ffff 256TB user
0xffff_0000_0000_0000 0xffff_ffff_ffff_ffff 256TB kernel
2. 內核內存佈局的打印
在arm64 4.16的內核之前,內核基本完成內存初始化工作後會打印出內核的內存佈局
qemu arm64打印如下:
這部分打印在mem_init()函數中實現(arch/arm64/mm/init.c)
start_kernel()->mm_init()->mem_init()
#define MLK(b, t) b, t, ((t) - (b)) >> 10
#define MLM(b, t) b, t, ((t) - (b)) >> 20
#define MLG(b, t) b, t, ((t) - (b)) >> 30
#define MLK_ROUNDUP(b, t) b, t, DIV_ROUND_UP(((t) - (b)), SZ_1K)
pr_notice("Virtual kernel memory layout:\n");
#ifdef CONFIG_KASAN
pr_notice(" kasan : 0x%16lx - 0x%16lx (%6ld GB)\n",
MLG(KASAN_SHADOW_START, KASAN_SHADOW_END));
#endif
pr_notice(" modules : 0x%16lx - 0x%16lx (%6ld MB)\n",
MLM(MODULES_VADDR, MODULES_END));
pr_notice(" vmalloc : 0x%16lx - 0x%16lx (%6ld GB)\n",
MLG(VMALLOC_START, VMALLOC_END));
pr_notice(" .text : 0x%p" " - 0x%p" " (%6ld KB)\n",
MLK_ROUNDUP(_text, _etext));
pr_notice(" .rodata : 0x%p" " - 0x%p" " (%6ld KB)\n",
MLK_ROUNDUP(__start_rodata, __init_begin));
pr_notice(" .init : 0x%p" " - 0x%p" " (%6ld KB)\n",
MLK_ROUNDUP(__init_begin, __init_end));
pr_notice(" .data : 0x%p" " - 0x%p" " (%6ld KB)\n",
MLK_ROUNDUP(_sdata, _edata));
pr_notice(" .bss : 0x%p" " - 0x%p" " (%6ld KB)\n",
MLK_ROUNDUP(__bss_start, __bss_stop));
pr_notice(" fixed : 0x%16lx - 0x%16lx (%6ld KB)\n",
MLK(FIXADDR_START, FIXADDR_TOP));
pr_notice(" PCI I/O : 0x%16lx - 0x%16lx (%6ld MB)\n",
MLM(PCI_IO_START, PCI_IO_END));
#ifdef CONFIG_SPARSEMEM_VMEMMAP
pr_notice(" vmemmap : 0x%16lx - 0x%16lx (%6ld GB maximum)\n",
MLG(VMEMMAP_START, VMEMMAP_START + VMEMMAP_SIZE));
pr_notice(" 0x%16lx - 0x%16lx (%6ld MB actual)\n",
MLM((unsigned long)phys_to_page(memblock_start_of_DRAM()),
(unsigned long)virt_to_page(high_memory)));
#endif
pr_notice(" memory : 0x%16lx - 0x%16lx (%6ld MB)\n",
MLM(__phys_to_virt(memblock_start_of_DRAM()),
(unsigned long)high_memory));
kasan: KASAN是一個動態檢測內存錯誤的工具, 原理是利用額外的內存標記可用內存的狀態. 這部分額外的內存被稱作shadow memory(影子區)。KASAN將1/8的內存用作shadow memory。
modules: 128MB的內核模塊區域,是內核模塊使用的虛擬地址空間
vmalloc: vmalloc函數使用的虛擬地址空間,kernel image也在vmalloc區域,內核鏡像的起始地址 = KIMAGE_ADDR + TEXT_OFFSET, TEXT_OFFSET是內存中的內核鏡像相對內存起始位置的偏移。
.text: 代碼段。 _text是代碼段的起始地址,_etext是結束地址, kernel image放在這段位置。
.rodata: read-only-data. 常量區,存放程序中定義爲const的全局變量。
.init: 對應大部分模塊初始化的數據,初始化結束後就會釋放這部分內存。
.data: 數據段。 包含內核大部分已初始化的全局變量。
.bss: 靜態內存分配段。 包含所有未初始化或初始化爲0的靜態全局變量。
fixed: 固定映射區。 在內核的啓動過程中,有些模塊需要使用虛擬內存並mapping到指定的物理地址上,而且,這些模塊也沒有辦法等待完整的內存管理模塊初始化之後再進行地址映射。因此,linux kernel固定分配了一些fixmap的虛擬地址,這些地址有固定的用途,使用該地址的模塊在初始化的時候,講這些固定分配的地址mapping到指定的物理地址上去。(Fix-Mapped Addresses)
PCI I/O: pci設備的I/O地址空間
vmemmap: 內存的物理地址如果不連續的話,就會存在內存空洞(稀疏內存),vmemmap就用來存放稀疏內存的page結構體的數據的虛擬地址空間。
memory: 線性映射區,範圍是【0xffff_8000_0000_0000, 0xffff_ffff_ffff_ffff】, 一共有128TB, 但這裏代碼對應的是memblock_start_of_DRAM()和memblock_end_of_DRAM()函數。
memory根據實際物理內存大小做了限制,所以memroy顯示了實際能夠訪問的內存區。
MLM(__phys_to_virt(memblock_start_of_DRAM()), (unsigned long)high_memory))
high_memory = __va(memblock_end_of_DRAM() - 1) + 1;
最終是通過dts或acpi中配置的memory節點確定的。
後面的內核版本刪掉了這段打印,如果需要的話可以手動revert掉該補丁。
3. 內核內存佈局圖
根據arm64啓動的打印信息, 確定arm64 內核內存佈局圖: