(二)Linux物理內存初始化【轉】

轉自:https://www.cnblogs.com/LoyenWang/p/11440957.html

背景

  • Read the fucking source code! --By 魯迅
  • A picture is worth a thousand words. --By 高爾基

說明:

  1. Kernel版本:4.14
  2. ARM64處理器,Contex-A53,雙核
  3. 使用工具:Source Insight 3.5, Visio

1. 介紹

讓我們思考幾個樸素的問題?

  1. 系統是怎麼知道物理內存的?
  2. 在內存管理真正初始化之前,內核的代碼執行需要分配內存該怎麼處理?

我們先來嘗試回答第一個問題,看過dts文件的同學應該見過memory的節點,以arch/arm64/boot/dts/freescale/fsl-ls208xa.dtsi爲例:

	memory@80000000 {
		device_type = "memory";
		reg = <0x00000000 0x80000000 0 0x80000000>;
		      /* DRAM space - 1, size : 2 GB DRAM */
	};

這個節點描述了內存的起始地址及大小,事實上內核在解析dtb文件時會去讀取該memory節點的內容,從而將檢測到的內存註冊進系統。

那麼新的問題又來了?Uboot會將kernel imagedtb拷貝到內存中,並且將dtb物理地址告知kernelkernel需要從該物理地址上讀取到dtb文件並解析,才能得到最終的內存信息,dtb的物理地址需要映射到虛擬地址上才能訪問,但是這個時候paging_init還沒有調用,也就是說物理地址的映射還沒有完成,那該怎麼辦呢?沒錯,Fixed map機制出現了。

第二個問題答案:當所有物理內存添加進系統後,在mm_init之前,系統會使用memblock模塊來對內存進行管理。

開啓探索之旅吧!

2. early_fixmap_init

簡單來說,Fixed map指的是虛擬地址中的一段區域,在該區域中所有的線性地址是在編譯階段就確定好的,這些虛擬地址需要在boot階段去映射到物理地址上。
來張圖片看看虛擬地址空間:

圖中 fixed: 0xffffffbefe7fd000 - 0xffffffbefec00000,描述的就是Fixed map的區域。

那麼這段區域中的詳細一點的佈局是怎樣呢?看看arch/arm64/include/asm/fixmap.h中的enum fixed_address結構就清晰了,圖來了:

從圖中可以看出,如果要訪問DTB所在的物理地址,那麼需要將該物理地址映射到Fixed map中的區域,然後訪問該區域中的虛擬地址即可。訪問IO空間也是一樣的道理,下文也會講述到。

那麼來看看early_fixmap_init函數的關鍵代碼吧:

void __init early_fixmap_init(void)
{
	pgd_t *pgd;
	pud_t *pud;
	pmd_t *pmd;
	unsigned long addr = FIXADDR_START;              /* (1) */

	pgd = pgd_offset_k(addr);           /* (2) */
	if (CONFIG_PGTABLE_LEVELS > 3 &&
	    !(pgd_none(*pgd) || pgd_page_paddr(*pgd) == __pa_symbol(bm_pud))) {
		/*
		 * We only end up here if the kernel mapping and the fixmap
		 * share the top level pgd entry, which should only happen on
		 * 16k/4 levels configurations.
		 */
		BUG_ON(!IS_ENABLED(CONFIG_ARM64_16K_PAGES));
		pud = pud_offset_kimg(pgd, addr);
	} else {
		if (pgd_none(*pgd))
			__pgd_populate(pgd, __pa_symbol(bm_pud), PUD_TYPE_TABLE);          /* (3) */
		pud = fixmap_pud(addr);
	}
	if (pud_none(*pud))
		__pud_populate(pud, __pa_symbol(bm_pmd), PMD_TYPE_TABLE);    /* (4) */
	pmd = fixmap_pmd(addr);
	__pmd_populate(pmd, __pa_symbol(bm_pte), PMD_TYPE_TABLE);        /* (5) */
......
}

關鍵點:

  1. FIXADDR_START,定義了Fixed map區域的起始地址,位於arch/arm64/include/asm/fixmap.h中;
  2. pgd_offset_k(addr),獲取addr地址對應pgd全局頁表中的entry,而這個pgd全局頁表正是swapper_pg_dir全局頁表;
  3. bm_pud的物理地址寫到pgd全局頁目錄表中;
  4. bm_pmd的物理地址寫到pud頁目錄表中;
  5. bm_pte的物理地址寫到pmd頁表目錄表中;

bm_pud/bm_pmd/bm_pte是三個全局數組,相當於是中間的頁表,存放各級頁表的entry,定義如下:

static pte_t bm_pte[PTRS_PER_PTE] __page_aligned_bss;
static pmd_t bm_pmd[PTRS_PER_PMD] __page_aligned_bss __maybe_unused;
static pud_t bm_pud[PTRS_PER_PUD] __page_aligned_bss __maybe_unused;

事實上,early_fixmap_init只是建立了一個映射的框架,具體的物理地址和虛擬地址的映射沒有去填充,這個是由使用者具體在使用時再去填充對應的pte entry。比如像fixmap_remap_fdt()函數,就是典型的填充pte entry的過程,完成最後的一步映射,然後才能讀取dtb文件。

來一張圖片就懂了,是透徹的懂了:

3. early_ioremap_init

如果在boot早期需要操作IO設備的話,那麼ioremap就用上場了,由於跟實際的內存管理關係不太大,不再太深入的分析。

簡單來說,ioremap的空間爲7 * 256K的區域,保存在slot_vir[]數組中,當需要進行IO操作的時候,最終會調用到__early_ioremap函數,在該函數中去填充對應的pte entry,從而完成最終的虛擬地址和物理地址的映射。

4. memblock

上文講的內容都只是鋪墊,爲了能正確訪問DTB文件並且解析得到物理地址信息。從入口到最終添加的調用過程如下圖:

所以,這個章節的重點就是memblock模塊,這個是早期的內存分配管理器,我不禁想起了之前在Nuttx中的內存池實現了,細節已然不太清晰了,但是框架性的思維都大同小異。

4.1 結構體

總共由三個數據結構來描述:

  • struct memblock定義了一個全局變量,用來維護所有的物理內存;
  • struct memblock_type代表系統中的內存類型,包括實際使用的內存和保留的內存;
  • struct memblock_region用來描述具體的內存區域,包含在struct memblock_type中的regions數組中,最多可以存放128個。

直接上個代碼吧:

static struct memblock_region memblock_memory_init_regions[INIT_MEMBLOCK_REGIONS] __initdata_memblock;
static struct memblock_region memblock_reserved_init_regions[INIT_MEMBLOCK_REGIONS] __initdata_memblock;
#ifdef CONFIG_HAVE_MEMBLOCK_PHYS_MAP
static struct memblock_region memblock_physmem_init_regions[INIT_PHYSMEM_REGIONS] __initdata_memblock;
#endif

struct memblock memblock __initdata_memblock = {
	.memory.regions		= memblock_memory_init_regions,
	.memory.cnt		= 1,	/* empty dummy entry */
	.memory.max		= INIT_MEMBLOCK_REGIONS,
	.memory.name		= "memory",

	.reserved.regions	= memblock_reserved_init_regions,
	.reserved.cnt		= 1,	/* empty dummy entry */
	.reserved.max		= INIT_MEMBLOCK_REGIONS,
	.reserved.name		= "reserved",

#ifdef CONFIG_HAVE_MEMBLOCK_PHYS_MAP
	.physmem.regions	= memblock_physmem_init_regions,
	.physmem.cnt		= 1,	/* empty dummy entry */
	.physmem.max		= INIT_PHYSMEM_REGIONS,
	.physmem.name		= "physmem",
#endif

	.bottom_up		= false,
	.current_limit		= MEMBLOCK_ALLOC_ANYWHERE,
};

定義的memblock爲全局變量,在定義的時候就進行了初始化。初始化的時候,regions指向的也是靜態全局的數組,其中數組的大小爲INIT_MEMBLOCK_REGIONS,也就是128個,限制了這些內存塊的個數了,實際在代碼中可以看到,當超過這個數值時,數組會以2倍的速度動態擴大。

初始化完了後,大體是這個樣子的:

4.2 memblock_add/memblock_remove

memblock子模塊,基本的邏輯都是圍繞內存的添加和移除操作來展開,最終是通過調用memblock_add_range/memblock_remove_range來實現的。

  • memblock_add_range

圖中的左側是函數的執行流程圖,執行效果是右側部分。右側部分畫的是一個典型的情況,實際的情況可能有多種,但是核心的邏輯都是對插入的region進行判斷,如果出現了物理地址範圍重疊的部分,那就進行split操作,最終對具有相同flagregion進行merge操作。

  • memblock_remove_range
    該函數執行的一個典型case效果如下圖所示:

假如現在需要移除掉一片區域,而該區域跨越了多個region,則會先調用memblock_isolate_range來對這片區域進行切分,最後再調用memblock_remove_region對區域範圍內的region進行移除操作。

當調用memblock_alloc函數進行地址分配時,最後也是調用memblock_add_range來實現的,申請的這部分內存最終會添加到reserved類型中,畢竟已經分配出去了,其他人也不應該使用了。

5. arm64_memblock_init

當物理內存都添加進系統之後,arm64_memblock_init會對整個物理內存進行整理,主要的工作就是將一些特殊的區域添加進reserved內存中。函數執行完後,如下圖所示:

  • 其中淺綠色的框表示的都是保留的內存區域, 剩下的部分就是可以實際去使用的內存了。

物理內存大體面貌就有了,後續就需要進行內存的頁表映射,完成實際的物理地址到虛擬地址的映射了。

那就待續吧。

作者:LoyenWang
出處:https://www.cnblogs.com/LoyenWang/
公衆號:LoyenWang
版權:本文版權歸作者和博客園共有
轉載:歡迎轉載,但未經作者同意,必須保留此段聲明;必須在文章中給出原文連接;否則必究法律責任
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章