爲什麼要內存管理:
早期的程序都是直接運行在物理地址上,也就是說這個程序所需要的空間不超過該機器的物理內存就不會有問題,但實際場景中都是多任務,多進程的,這種物理地址reserved給各個進程是不靠譜的。舉個栗子:假如有3個程序a,b,c,a需要10M,b需要100M,c需要20M,總內存就120M,按照之前的分配方式,前10M給a,10M-110M給b,系統還剩10M,但是c需要20M,顯然剩下的內存是不夠c用的。怎麼辦?
1.效率問題
可能你會想到當c程序跑的時候把b程序數據寫到磁盤上,等運行b的時候再數據從磁盤寫回來,先不說無法滿足b,c程序並行跑的需求,就連頻繁的io操作帶來的耗時問題也是無法接收的。
2.進程地址隔離問題
除了效率問題,reserved給進程的空間如果需要被別的進程訪問會出現崩潰。比如a進程訪問的空間是前10M,但是a程序中有一段代碼訪問10-110M的話就有可能導致b程序的崩潰,所以進程的地址空間需要彼此隔離。
3.重定位問題
現實場景中不可能是單任務在分好的內存中運行,當多任務並行跑的情況下在動態申請釋放內存的時候有可能申請到其它進程裏的地址,這時候需要重定位到新的地址。
內存管理無非就是想辦法解決上面三個問題,如何提高內存的使用效率?如何使進程的地址空間隔離?如何解決程序運行時的重定位問題?
內存管理如何從虛擬地址映射到物理地址:
內存管理從虛擬地址映射到物理地址的過程也就是解決上面3個問題的過程。內存管理用分段機制和分頁機制分別解決了上面的3個問題,大概過程如下圖:
分段機制:
只要程序分了段,把整個段平移到任何位置後,段內的地址相對段基址是不變的,無論段基址是多少,只要給出段內偏移地址,cpu就能訪問到正確的指令。於是加載用戶程序時,只要將整個段的內容複製到新的位置,再將段基址寄存器中的地址改成該地址,程序便可準確地運行,因爲程序中用的是段內偏移地址,相對新的段基址,該偏移地址處的內容內容還是一樣的。
可以看出分段機制解決了進程間隔離和重定位的問題。
分頁機制:
可以參考《CPU是如何訪問內存的?》瞭解一級頁表的概念,linux爲了兼容32位和64位,通常採用四級頁表,頁全局目錄,頁上級目錄,頁中間目錄,頁表:
這裏不詳細解釋linux是如何通過四級頁表來做線性地址(虛擬地址)到物理地址的轉化。網上有很多,推薦https://www.cnblogs.com/linhaostudy/p/10038100.html#autoid-2-2-0。
總而言之,linux採用段頁結合的尋址方式有效的解決了上面三個問題,我們用一張圖詳細描述下:
進程在切換的時候就是根據task_struct找到mm_struct裏的pgd字段,取得新進程的頁全局目錄,然後填充到CR3寄存器,就完成了頁的切換。
動手看下mmu分頁尋址的過程:
上代碼:
#include <linux/module.h>
#include <linux/kernel.h>
#include <linux/init.h>
#include <linux/sched.h>
#include <linux/pid.h>
#include <linux/mm.h>
#include <asm/pgtable.h>
#include <asm/page.h>
MODULE_DESCRIPTION("vitual address to physics address");
static int pid;
static unsigned long va;
module_param(pid,int,0644); //從命令行傳遞參數(變量,類型,權限)
module_param(va,ulong,0644); //va表示的是虛擬地址
static int find_pgd_init(void)
{
unsigned long pa = 0; //pa表示的物理地址
struct task_struct *pcb_tmp = NULL;
pgd_t *pgd_tmp = NULL;
pud_t *pud_tmp = NULL;
pmd_t *pmd_tmp = NULL;
pte_t *pte_tmp = NULL;
printk(KERN_INFO"PAGE_OFFSET = 0x%lx\n",PAGE_OFFSET); //頁表中有多少個項
/*pud和pmd等等 在線性地址中佔據多少位*/
printk(KERN_INFO"PGDIR_SHIFT = %d\n",PGDIR_SHIFT);
//注意:在32位系統中 PGD和PUD是相同的
printk(KERN_INFO"PUD_SHIFT = %d\n",PUD_SHIFT);
printk(KERN_INFO"PMD_SHIFT = %d\n",PMD_SHIFT);
printk(KERN_INFO"PAGE_SHIFT = %d\n",PAGE_SHIFT);
printk(KERN_INFO"PTRS_PER_PGD = %d\n",PTRS_PER_PGD); //每個PGD裏面有多少個ptrs
printk(KERN_INFO"PTRS_PER_PUD = %d\n",PTRS_PER_PUD);
printk(KERN_INFO"PTRS_PER_PMD = %d\n",PTRS_PER_PMD); //PMD中有多少個項
printk(KERN_INFO"PTRS_PER_PTE = %d\n",PTRS_PER_PTE);
printk(KERN_INFO"PAGE_MASK = 0x%lx\n",PAGE_MASK); //頁的掩碼
struct pid *p = NULL;
p = find_vpid(pid); //通過進程的pid號數字找到struct pid的結構體
pcb_tmp = pid_task(p,PIDTYPE_PID); //通過pid的結構體找到進程的task struct
printk(KERN_INFO"pgd = 0x%p\n",pcb_tmp->mm->pgd);
// 判斷給出的地址va是否合法(va<vm_end)
if(!find_vma(pcb_tmp->mm,va)){
printk(KERN_INFO"virt_addr 0x%lx not available.\n",va);
return 0;
}
pgd_tmp = pgd_offset(pcb_tmp->mm,va); //返回線性地址va,在頁全局目錄中對應表項的線性地址
printk(KERN_INFO"pgd_tmp = 0x%p\n",pgd_tmp);
//pgd_val獲得pgd_tmp所指的頁全局目錄項
//pgd_val是將pgd_tmp中的值打印出來
printk(KERN_INFO"pgd_val(*pgd_tmp) = 0x%lx\n",pgd_val(*pgd_tmp));
if(pgd_none(*pgd_tmp)){ //判斷pgd有沒有映射
printk(KERN_INFO"Not mapped in pgd.\n");
return 0;
}
pud_tmp = pud_offset(pgd_tmp,va); //返回va對應的頁上級目錄項的線性地址
printk(KERN_INFO"pud_tmp = 0x%p\n",pud_tmp);
printk(KERN_INFO"pud_val(*pud_tmp) = 0x%lx\n",pud_val(*pud_tmp));
if(pud_none(*pud_tmp)){
printk(KERN_INFO"Not mapped in pud.\n");
return 0;
}
pmd_tmp = pmd_offset(pud_tmp,va); //返回va在頁中間目錄中對應表項的線性地址
printk(KERN_INFO"pmd_tmp = 0x%p\n",pmd_tmp);
printk(KERN_INFO"pmd_val(*pmd_tmp) = 0x%lx\n",pmd_val(*pmd_tmp));
if(pmd_none(*pmd_tmp)){
printk(KERN_INFO"Not mapped in pmd.\n");
return 0;
}
//在這裏,把原來的pte_offset_map()改成了pte_offset_kernel
pte_tmp = pte_offset_kernel(pmd_tmp,va); //pte指的是 找到表
printk(KERN_INFO"pte_tmp = 0x%p\n",pte_tmp);
printk(KERN_INFO"pte_val(*pte_tmp) = 0x%lx\n",pte_val(*pte_tmp));
if(pte_none(*pte_tmp)){ //判斷有沒有映射
printk(KERN_INFO"Not mapped in pte.\n");
return 0;
}
if(!pte_present(*pte_tmp)){
printk(KERN_INFO"pte not in RAM.\n");
return 0;
}
pa = (pte_val(*pte_tmp) & PAGE_MASK) ;//物理地址的計算方法
printk(KERN_INFO"virt_addr 0x%lx in RAM Page is 0x%lx .\n",va,pa);
//printk(KERN_INFO"contect in 0x%lx is 0x%lx\n",pa,*(unsigned long *)((char *)pa + PAGE_OFFSET));
return 0;
}
static void __exit find_pgd_exit(void)
{
printk(KERN_INFO"Goodbye!\n");
}
module_init(find_pgd_init);
module_exit(find_pgd_exit);
MODULE_LICENSE("GPL");
可以看出虛擬地址ffff99b488d48000對應的物理地址是80000000c8d48000。這個過程也是mmu的過程。
添加極客助手微信,加入技術交流羣
長按,掃碼,關注公衆號