自己動手寫操作體統 pmtest1.asm 詳細解釋

本文來自CSDN博客，轉載請標明出處：http://blog.csdn.net/wangshenwq/archive/2008/09/14/2927636.aspx

段機制輕鬆體驗
內存尋址：
實模式下的內存尋址：
讓我們首先來回顧實模式下的尋址方式
段首地址×16＋偏移量＝物理地址
爲什麼要×16？因爲在8086CPU中，地址線是20位，但寄存器是16位的，最高尋址64KB，它無法尋址到1M內存。於是，Intel設計了這種尋址方式，先縮小4位成16位放入到段寄存器，用到時候，再將其擴大到20位，這也造成了段的首地址必須是16的倍數的限制。
公式：xxxx:yyyy
保護模式下分段機制的內存尋址：
分段機制是利用一個稱作段選擇符的偏移量，從而到描述符表找到需要的段描述符，而這個段描述符中就存放着真正的段的物理首地址，再加上偏移量
一段話，出現了三個新名詞：
段選擇子
描述符表
段描述符
＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝
我們現在可以這樣來理解這段話：
有一個結構體類型，它有三個成員變量：
段物理首地址
段界限
段屬性
內存中，維護一個該結構體類型的數組。
而分段機制就是利用一個索引，找到該數組對應的結構體，從而得到段的物理首地址，然後加上偏移量，得到真正的物理地址。
公式：xxxx:yyyyyyyy
其中，xxxx也就是索引，yyyyyyyy是偏移量（因爲32位寄存器，所以8個16進制）xxxx存放在段寄存器中。
＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝
現在，我們來到過來分析一下那三個新名詞：
段描述符：一個結構體，它有三個成員變量：
段物理首地址
段界限
段屬性
描述符表：也就是一個數組，什麼樣的數組呢？是一個段描述符組成的數組。
段選擇子：也就是數組的索引，但這時候的索引不在是高級語言中數組的下標，而是我們將要找的那個段描述符相對於數組首地址（也就是全局描述表的首地址）偏移位置。
就這麼簡單，如圖：

圖中，通過Selector（段選擇子）找到存儲在Descriptor Table（描述符表）中某個Descriptor（段描述符），該段描述符中存放有該段的物理首地址，所以就可以找到內存中真正的物理段首地址Segment
Offset（偏移量）：就是相對該段的偏移量
物理首地址＋偏移量就得到了物理地址本圖就是DATA
但這時，心細的朋友就發現了一個GDTR這個傢伙還沒有提到!
我們來看一下什麼是GDTR
Global Descriptor Table Register（全局描述符表寄存器）
但是這個寄存器有什麼用呢？
大家想一下，段描述符表現在是存放在內存中，那CPU是如何知道它在哪裏呢？所以，Iterl公司設計了一個全局描述符表寄存器，專門用來存放段描述符表的首地址，以便找到內存中段描述符表。
這時，段描述符表地址被存到GDTR寄存器中了。
＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝
好了，分析就到這，我們來看一下正式的定義：
當x86 CPU 工作在保護模式時，可以使用全部32根地址線訪問4GB的內存，因爲80386的所有通用寄存器都是32位的，所以用任何一個通用寄存器來間接尋址，不比分段就可以訪問4G空間中任意的內存地址。
但這並不意味着，此時段寄存器就不再有用了。實際上，段寄存器更加有用了，雖然再尋址上沒有分段的限制了，但在保護模式下，一個地址空間是否可以被寫入，可以被多少優先級的代碼寫入，是不是允許執行等等涉及保護的問題就出來了。要解決這些問題，必須對一個地址空間定義一些安全上的屬性。段寄存器這時就派上了用場。但是設計屬性和保護模式下段的參數，要表示的信息太多了，要用64位長的數據才能表示。我們把着64位的屬性數據叫做段描述符，上面說過，它包含3 個變量：
段物理首地址、段界限、段屬性
80386的段寄存器是16位（注意：通用寄存器在保護模式下都是32位，但段寄存器沒有被改變）的，無法放下保護模式下64位的段描述符。如何解決這個問題呢？方法是把所有段的段描述符順序存放在內存中的指定位置，組成一個段描述符表（Descriptor Table）；而段寄存器中的16位用來做索引信息，這時，段寄存器中的信息不再是段地址了，而是段選擇子（Selector）。可以通過它在段描述符表中“選擇”一個項目已得到段的全部信息。
那麼段描述符表存放在哪裏呢？80386引入了兩個新的寄存器來管理段描述符，就是GDTR和LDTR，（LDTR大家先忘記它，隨着學習的深入，我們會在以後學習）。
這樣，用以下幾步來總體體驗下保護模式下尋址的機制
1、段寄存器中存放段選擇子Selector
2、GDTR中存放着段描述符表的首地址
3、通過選擇子根據GDTR中的首地址，就能找到對應的段描述符
4、段描述符中有段的物理首地址，就得到段在內存中的首地址
5、加上偏移量，就找到在這個段中存放的數據的真正物理地址。
好的，那我們開始編碼，看看如何實現先前描述的內容
＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝
首先，既然我們需要一個數組，全局描述符表，那我們就定義一塊連續的結構體：
[SECTION .gdt] ;爲了代碼可讀性，我們將這個數組放到一個節中
；由一塊連續的地址組成的，不就是一個數組嗎？看下面代碼，^_^
段基地址段界限段屬性
GDT_BEGIN: Descriptor 0, 0, 0
GDT_CODE32: Descriptor 0, 0, DA_C
;上面，我定義了二個連續地址的結構體，大家先認爲Descriptor就是一個結構體類型，我們會在以後詳細講述
；第一個結構體，全部是0，是爲了遵循Interl規範，先記得就OK
；第二個定義了一個代碼段，段基地址和段界限我們暫且還不知道，先初始化爲0，但是因爲是個代碼段，代碼段具備執行的屬性，那麼DA_C就代表是一個可執行代碼段，DA_C是一個預先定義好的常量，我們會在詳細講解段描述符中講解。
＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝
我們繼續來實現，那麼下面，我們就需要設計段選擇子了，因爲上面代碼已經包含了段描述符和全局描述符表
還記得選擇子是個什麼東西嗎？
段選擇子：也就是數組的索引，但這時候的索引不在是高級語言中數組的下標，而是我們將要找的那個段描述符相對於數組首地址（也就是全局描述表的首地址）偏移位置。
看我代碼怎麼實現，包含以上代碼不再說明:
[SECTION .gdt]
GDT_BEGIN: Descriptor 0, 0, 0
GDT_CODE32: Descriptor 0, 0, DA_C
;下面是定義代碼段選擇子，它就是相對數組首地址的偏移量
SelectorCode32 equ GDT_CODE32 - GDT_BEGIN
;因爲第一個段描述符，不被使用，所以就不比設置段選擇子了。
＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝
偏移地址：
注意一點，我們在程序中使用的都是偏移地址，相對於段的偏移地址，用上面的例子來說，象 GDT_CODE32 GDT_BEGIN 這些結構體的首地址都是相對於數據段的偏移量。什麼意思呢？
因爲我們的程序到底加載到內存的哪個地方是不固定，不知道的，只需使用偏移地址操作就行了，如：
SelectorCode32 ，它本身就是一個偏移地址
但是SelectorCode32 equ GDT_CODE32 - GDT_BEGIN
怎麼解釋呢？
GDT_CODE32是相對於數據段的偏移量，
GDT_BEGIN也是相對於數據段的偏移量，雖然它是數組的首地址，說的羅索一些，GDT_BEGIN是數組的首地址（用數組的概念來理解頁不錯哦可以看作數組下標0），但是它是相對於數據段的偏移量
那麼兩個偏移量相減就是GDT_CODE32 相對於GDT_BEGIN的偏移量 (這個記住就行了，同時也是兩個偏移量的長度)

舉個例子：0 1 2 3，一個偏移0表示佔據 0這個地址，一個偏移3表示佔據3這個地址（談偏移要把前面要偏移的那個參照物拿掉，去掉要偏移的參照物（其實就可以數學表示成減前一個偏移參照物），剩下的就是偏移量），3這個地址相對與0這個地址的偏移量是把0這個地址先起掉後再算。（再結合數組來理解就可以了）
所以，我們要時時刻刻記得，在程序中，我們永遠使用的是偏移量，因爲我們不知道程序將要被加載內存那塊地方。
好了，基礎也學的差不多了，下面我們要自己動手寫一段程序，實現實模式到保護模式之間的跳轉
=====================================================================
;實現從實模式到保護模式之間的跳轉
；參考：《自己動手寫操作系統》
----------------------------------------------------------------------
%include "pm.inc"

org 0100h
jmp LABEL_BEGIN
[SECTION .gdt]
GDT_BEGIN: Descriptor 0, 0,   0
GDT_CODE32: Descriptor 0, LenOfCode32 - 1, DA_C + DA_32   //程序段描述符的基地址首先置位0，以後還要重置爲32位程序段物理首地址
GDT_VIDEO: Descriptor 0B8000H, 0FFFFH,   DA_DRW                //這個32位程序段的物理首地址是在實模式下計算得到的。
GdtLen equ $ - GDT_BEGIN       //長度=偏移量1---偏移量2 。如偏移4-偏移2得到長度爲2 。 $表示當前的偏移量
GdtPtr dw GdtLen - 1                  //定義了一個Gdtptr的數據結構，低16位dw部分爲位段界限，高32位爲0，一共48位，高32位以後還要重置

dd 0                                             //0，1爲低16位，高32位是從2開始，所以GdtPtr+2。高32位應該放GDT的物理地址
;定義段選擇子
SelectorCode32 equ GDT_CODE32 - GDT_BEGIN
SelectorVideo equ GDT_VIDEO - GDT_BEGIN
[SECTION .main]
[BITS 16]
LABEL_BEGIN:
mov ax, cs
mov ds, ax                             //這個ds es ss等於cs 表示代碼段和數據段在同一個街道上，只是偏移量不一樣。
mov es, ax
mov ss, ax                           //段寄存器就相當於街道號，偏移量就相當於門牌號。只有兩者組合起來才能形成真正的物理地址。

//看到段寄存器就應該想象成街道號，看到偏移量就應該想象成門牌號

//如果代碼中只出現偏移量，實際上也是和操作系統所默認的這個偏移量的段寄存器（只是代碼沒有顯式給出而已）一起組成物理地址，（如ip它默認的段寄存器就是cs），代碼也可以顯式給出段寄存器和偏移量，這個時候的段寄存器就不一定是這個偏移量所默認的段寄存器。

1、初始化32位代碼段描述符的段基址
;我們可以在實模式下通過段寄存器×16 ＋偏移兩得到物理地址，
;那麼，我們就可以將這個物理地址放到段描述符中，以供保護模式下使用，
;因爲保護模式下只能通過段選擇子＋偏移量
xor eax, eax
mov ax, cs
shl eax, 4
add eax, LABEL_CODE32
mov word [GDT_CODE32 + 2],ax     // 物理地址的ax放在段基址 2，3
shr eax, 16
mov byte [GDT_CODE32 + 4],al
mov byte [GDT_CODE32 + 7],ah
2、得到段描述符表的物理地址，並將其放到GdtPtr中
xor eax, eax
mov ax, ds                                       // GDT的段地址爲數據寄存器DS,
shl eax, 4
add eax, GDT_BEGIN                     //DS加上偏移量GDT_BEGIN就是GDT的物理地址
mov dword [GdtPtr + 2],eax            //dword 表示是雙字所以爲32位，eax也是32位啊。

;加載到gdtr,因爲現在段描述符表在內存中，我們必須要讓CPU知道段描述符表在哪個位置
;通過使用lgdtr就可以將源加載到gdtr寄存器中
lgdt [GdtPtr]
3、關中斷
cli
4、打開A20線
in al, 92h
or al, 00000010b
out 92h, al
5、準備切換到保護模式，設置PE爲1
mov eax, cr0
or eax, 1
mov cr0, eax
;現在已經處在保護模式分段機制下，所以尋址必須使用段選擇子：偏移量來尋址

6、跳轉到32位代碼段中
;因爲此時偏移量位32位，所以必須dword告訴編譯器，不然，編譯器將編譯成16位
jmp dword SelectorCode32:0;跳轉到32位代碼段第一條指令開始執行

[SECTION .code32]
[BITS 32]
LABEL_CODE32:
mov ax, SelectorVideo
mov es, ax
xor edi, edi
mov edi, (80 * 10 + 10)
mov ah, 0ch
mov al, 'G'
mov [es:edi],ax
jmp $
LenOfCode32 equ $ - LABEL_CODE32
＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝
這段代碼的大概意思是：
先在16位代碼段，實模式下運行，在實模式下，通過段寄存器×16+偏移量得到32位代碼的真正物理首地址，並將放入到段描述符表中，以供在保護模式下使用，上面說過了，保護模式下尋址，是通過段選擇子，段描述符表，段描述符一起工作尋址的。所以在實模式下所做的工作就是初始化段描述符表裏的所有段描述符。
我們來看一下段描述符表，它有3個段描述符：
GDT_BEGIN
GDT_CODE32
GDT_VIDEO
GDT_BEGIN,遵循Intel公司規定，全部置0
GDT_CODE32,32位代碼段描述符，供保護模式下使用
GDT_VIDEO,顯存段首地址，我們知道，顯存首地址是0B8000H.
回想一下，我們在實模式下往顯示器上輸出文字時，我們設置段寄存器爲
0B800h,（注意後面比真正物理地址少一個0）。
而我們現在在保護模式下訪問顯存，那麼0B8000h就可以直接放到段描述符中即可。因爲段描述符中存放的是段的真正的物理地址。
下面我們來逐行分析該代碼
org 0100h
這句話告訴加載器，將這段程序加載到偏移段首地址0100h處，即：偏移256字節處，爲什麼要加載到偏移256個字節處呢？

這是因爲，在DOS中，需要留下256個字節和DOS系統進行通信。
jmp LABEL_BEGIN
執行這句話就跳轉到LABEL_BEGIN處開始執行。
好，我們看一下LABEL_BEGIN在那塊，也就是16位代碼段
[SECTION .main]
[BITS 16]
LABEL_BEGIN: （意味着運行在實模式）
這樣程序就從.main節的第一段代碼開始執行。
我們看一下上面的代碼，[BITS 16]告訴編譯器，這是一個16位代碼段，所使用的寄存器都是16位寄存器。
該代碼段初始化所有段描述符表中的段物理首地址
首先在實模式下計算出32位代碼段的物理首地址
對照段值 × 16 ＋偏移量＝物理地址
1 mov ax, cs                                                        //
2 shl eax, 4 ;向左移動4位，不就是×16嗎？呵呵 //   CS存儲着有操作體統分配的代碼段值，段值*16 得到代碼段的物理首地址(注意這是在實模式下)
；到現在爲止，eax就是代碼段的物理首地址了，那麼。。。看
3 add eax, LABEL_CODE32                              // 所有的諸如LABEL_CODE32：這樣的都表示是偏移量，因爲物理首地址的段值是由操作系統分配的。
;爲eax （代碼段首地址）加上 LABEL_CODE32偏移量，得到的不就是LABEL_CODE32的真正物理地址了嗎？

上面說過，代碼中，使用的變量，或者標籤都是相對程序物理首地址的偏移量。如：LABEL_CODE32 這個標籤就是相對程序物理首地址的偏移量。
OK，現在我們已經知道了32位代碼段的物理首地址，那麼將eax放入到段描述符中就行了
我們先假設Descriptor就是一個結構體類型，（實際它是一個宏定義的數據結構，爲了不影響整體思路，我們放到以後講）
看一下這個Descriptor段描述符的內存模型：
; 高地址………………………………………………………………………低地址
; |   7   |   6   |   5   |   4   |   3   |   2   |   1   |   0   |
共 8 字節
; |--------========--------========--------========--------========|
; ┏━━━┳━━━━━━━┳━━━━━━━━━━━┳━━━━━━━┓
; ┃31..24┃   段屬性   ┃   段基址(23..0)   ┃ 段界限(15..0)┃
; ┃   ┃       ┃   |       ┃       ┃
; ┃ 基址2┃       ┃基址1b│   基址1a   ┃   段界限1 ┃
; ┣━━━╋━━━┳━━━╋━━━━━━━━━━━╋━━━━━━━┫
; ┃   %6 ┃ %5 ┃ %4 ┃ %3 ┃   %2   ┃   %1   ┃
; ┗━━━┻━━━┻━━━┻━━━┻━━━━━━━┻━━━━━━━┛
由於歷史原因，段描述符的內存排列不是按照段基地址段界限段屬性這樣的來排列的，所以我們現在要想一種辦法，把eax裏所存放的物理首地址拆開，分別放到2,3,4,7字節處
那麼很顯然，我們可以將eax寄存器中的ax先放到2,3字節處
mov word [GDT_CODE32 + 2],ax  // 這種內存訪問方式也是很常見的，首地址爲數據寄存器提供（這裏數據寄存器等於代碼寄存器），GDT_CODE32爲偏移量，再加2
因爲在偏移2個字節處，所以，首地址 + 2,才能定位到下標爲2的字節開頭處
而，word 告訴編譯器，我要一次訪問2個字節的內存
好，簡單的搞定了，那麼再看，我們現在要將eax高16字節分別放到下標爲4,7字節處。
雖然eax的ax代表低16位，但是Intel並沒有給高位一個名字定義，（不會是high ax，呵呵），所以，我們沒有辦法去訪問高位。但是我們可以將高16位放到低16位中，因爲這時，低16位我們已經不關心它的值了。
好，看代碼
shr eax, 16
這句代碼就將eax向右移動16位，低位被拋棄，高位變成了低位。呵呵。。。
現在好辦了，低16位又可以分爲al,和 ah，那麼現在我們就將al放到4位置，ah放到7位置吧
mov byte [GDT_CODE32 + 4], AL
mov byte [GDT_CODE32 + 7], AH
不用我再解釋這段代碼了，自己去分析爲什麼吧。。。。

//上面程序的功能是把32位程序段的物理首地址放到程序段描述符的段基址中,以便跳轉到保護模式時，可以使用選擇子選用程序段描述符，從而得到32位程序段的物理首地址。

好了，32位代碼段描述符設置好了，其界限設置看代碼吧，爲什麼要那樣設置，很簡單的，界限＝長度－ 1，段屬性:
DA_C: 98h 可執行
DA_32: 4000h 32位代碼段
是個常量，換算成二進制位，對照段描述符屬性位置去看吧，參考任意一本保護模式書。
段描述符設置好了，但是，這段描述符表，還在內存中，我們必須想辦法放到寄存器中，這時，就用到了gdtr(Golbal Descriptor Table Register)，使用一條指令
lgdtr [GdtPtr]
就可以將GdtPtr加載到gdtr中
而gdtr的內存模型是：
高字節低字節

但GdtPtr是什麼呢？
就是我們定義的和這個寄存器內存模型一摸一樣的結構體:
GdtLen equ $ - LABEL_BEGIN
GdtPtr dw GdtLen - 1   ；界限
dd 0   ；真正物理地址
那現在我們就要計算GdtPtr第二個字節也就是真正物理地址了
xor eax, eax
mov ax, ds
shl eax, 4
add eax, GDT_BEGIN
mov dword [GdtPtr + 2],eax              // dword表示爲32位
自己分析吧，和計算32位段首地址基本一樣的，
搞定後，使用lgdt [GdtPtr]就將此加載到寄存器GDTR中了
然後關中斷
cli 實模式下的中斷和保護模式下的中斷處理不一樣，那就關吧，規矩
開啓A20線
in al, 92h
or al, 00000010b
out 92h, al
如果不開啓A20線，就無辦法訪問1M之上的內存，沒辦法，開啓吧，規矩，想知道歷史了，去查吧
然後設置CR0的PE位
mov eax, cr0
or eax, 1
mov cr0, eax
這個簡單說一下，以後再詳細
CR0也是一個寄存器，其中有個PE位，如果爲0，就說明爲實模式，
如果置1，說明爲保護模式。現在我們要進入保護模式下工作，那麼就要設置PE爲1。
好了，看一下這個main節中的最後一個代碼
jmp dword SelectorCode32 : 0
哈哈，現在已經再保護模式下了，當然要使用段選擇子＋偏移量來尋址啊，這樣不就是尋址到了32位代碼段中去了嗎，偏移量爲0不就說明從第一個代碼開始執行。
不是嗎？呵呵，那dword了？
因爲現在的代碼段是16位，編譯器只能將它編譯位16位，但處於保護模式下，它的偏移量應該是32位，所以，要顯示告訴編譯器，我這裏使用的是32位，把我這塊給編譯成32位的！！！
如果不加dword，
jmp SelectorCode32:0
這句話不會出什麼問題，16位的0是0，32位的0還是0，但如果這樣呢？：
jmp SelectorCode32:0x12345678
跳轉到偏移0x12345678中，這時就錯了
如果不將dword,編譯器就將該地址截斷成16位，取低位，變成了0x5678
你說對嗎？哈哈
所以我們必須這樣做：
jmp dword SelectorCodde32:0x12345678
OKEY,我們繼續追擊，執行完上面那個跳轉後，
代碼就跳到了32位代碼段的中，開始執行第一條指令
mov ax, SelectorVideo
再看
mov es,ax                         //現在已經在保護模式下，通過選擇子找到顯存的基址放

呵呵，實模式下，放的是16位的段值，而現在呢，不就是要將段選擇子放到段寄存器裏嗎？然後通過段選擇子（偏移量）找到描述符表中對應的段描述符的嗎！！！！
繼續看下面代碼
xor edi, edi
mov edi, (80 * 10 + 10)
mov ah, 0ch
mov al, 'G'
跟實模式下差不多，設置目標10行10列
設置現實字符：G
mov [es:edi],ax
也和實模式下一樣，
只不過實模式是這樣來尋址：
es×16 ＋ edi
而保護模式下呢
es是一個偏移，根據這個偏移找到段描述符表中的對應顯存段，然後這個顯存段裏存放的就是0B8000h，然後在加上偏移不就的了嗎！！！
哈哈。。。。程序分析完畢，細節之處，自己體會去
總結：
1. 注意程序中使用的全部是偏移地址。注意兩種偏移地址
A 對於程序的起始地址來說，所有變量和標籤都是相對於整個程序的偏移量
B 對於段中定義的代碼，有兩種偏移：
相對於程序起始地址的偏移
相對於段標籤的偏移。
2.不管是實模式下的物理地址，還是保護模式下的物理地址，反正他們都是物理地址，呵呵，實模式下求的物理地址，也能在保護模式下使用，只是他們不同的是，如何尋址的方式不一樣。
3.一個程序中可以包含多個不同位的段，32位或者16位，他們之間也可以互相跳轉，只是32位段用的是32位寄存器，16位代碼段用的是16位寄存器，如果要在16位段下使用32位寄存器，必須象高級語言中強制類型轉換一樣，顯示的定義 dword
參考：《自動動手寫操作系統》
《Undocument Windows 2000 Secrets》
《Linux 內核完全剖析》

自己動手寫操作體統 pmtest1.asm 詳細解釋

C語言--右移左移

12款高效開源Wiki系統推薦，打造團隊知識管理利器

一個開源且全面的C#算法實戰教程

dotnet 基於 DirectML 控制檯運行 Phi-3 模型

自定義MyBatis插件

一款.NET開源、功能強大、跨平臺的繪圖庫 - OxyPlot

常用的 Git 指令

鼠標控制軟件有可能和虛擬機軟件產生衝突

sm4加密工具類

android的控件框架

fanfoudroid 總體運作流程

自己動手寫操作體統 pmtest1.asm 詳細解釋

mysql++ 中遇到的安裝問題及linux下C++添加共享庫

MakeFile文件的書寫規範

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結