[轉]AT&T 彙編參考

 AT&TASM
 
      開發一個OS,儘管絕大部分代碼只需要用C/C++等高級語言就可以了,但至少和硬件相關部分的代碼需要使用彙編語言,另外,由於啓動部分的代碼有大小限制,使用精練的匯 編可以縮小目標代碼的尺寸。另外,對於某些需要被經常調用的代碼,使用匯編可以提高性能。所以我們必須瞭解彙編語言,即使你有可能並不喜歡它。
 
如果你是計算機專業的話,在大學裏你應該學習過Intel格式的8086/80386彙編,這裏就不再討論。如果我們選擇的OS開發工具是GCC以及GAS的話,就必須瞭解AT&T 彙編語言語法,因爲GCC/GAS只支持這種彙編語法。
 
1. Syntax
  
Register Reference
  
゚     引用寄存器要在寄存器號前加百分號%,如“movl %eax, %ebx”。
 
゚     80386有如下寄存器:
 
゚     8個32-bit寄存器 %eax,%ebx,%ecx,%edx,%edi,%esi,%ebp,%esp;
 
゚     8個16-bit寄存器,它們事實上是上面8個32-bit寄存器的低16位:%ax,%bx,
 
%cx,%dx,%di,%si,%bp,%sp;
 
゚     8個8-bit寄存器:%ah,%al,%bh,%bl,%ch,%cl,%dh,%dl。它們事實上 是寄存器%ax,%bx,%cx,%dx 的高8位和低8位;
 
゚     6個段寄存器:%cs(code),%ds(data),%ss(stack),%es,%fs,%gs;
 
゚     3個控制寄存器:%cr0,%cr2,%cr3;
 
゚     6個debug寄存器:%db0,%db1,%db2,%db3,%db6,%db7;
 
゚     2個測試寄存器:%tr6,%tr7;
 
゚     8 個浮點寄存器棧:%st(0),%st(1),%st(2),%st(3),%st(4),%st(5),%st(6),%st(7)。

 
 Operator Sequence
  
操作數排列是從源(左)到目的(右),如“movl%eax(源),%ebx(目的)”
 
ImmediatelyOperator
  
使用立即數,要在數前面加符號$,  如“movl$0x04,%ebx”
 
或者:
  
para=0x04
 
movl$para,%ebx
 
指令執行的結果是將立即數04h裝入寄存器ebx。
 
 
Symbol Constant
 
符號常數直接引用如 value:.long0x12a3f2de movlvalue,%ebx
 
指令執行的結果是將常數0x12a3f2de裝入寄存器ebx。
 
引用符號地址在符號前加符號$,  如“movl$value,%ebx”則是將符號value的地址裝入 寄存器ebx。
 
 
Length of Operator 
 
操作數的長度用加在指令後的符號表示b(byte,  8-bit), w(word, 16-bits), l(long,32-bits),如“movb %al, %bl”,“movw

 

%ax,%bx”,“movl %eax,%ebx”。
 
如果沒有指定操作數長度的話,編譯器將按照目標操作數的長度來設置。比如指令“mov %ax,%bx”,由於目標操作數bx的長度爲

 

word,那麼編譯器將把此指令等同於“movw %ax,%bx”。同樣道理,指令“mov$4,%ebx”等同於指令“movl$4,%ebx”,

 

“push%al”等同於“pushb%al”。對於沒有指定操作數長度,但編譯器又無法猜測的指令,編譯器將會報錯,比如指令push$4”。


 
 Sign and Zero Extension
  
絕大多數面向80386的AT&T彙編指令與Intel格式的彙編指令都是相同的,符號擴展 指令和零擴展指令則是僅有的不同格式指令。
 
符號擴展指令和零擴展指令需要指定源操作數長度和目的操作數長度,即使在某些指令中這些操作數是隱含的。
 
在AT&T語法中,符號擴展和零擴展指令的格式爲,基本部分"movs"和"movz"(對應 Intel語法的movsx和movzx),後面跟上源操作數

 

長度和目的操作數長度。movsbl意味着 movs(from)byte(to)long;movbw意味着movs(from)byte(to)word;movswl

 

意味着movs  (from)word  (to)long。對於movz指令也一樣。比如指令“movsbl %al,%edx”意味着將al寄存器的內容進行符號

 

擴展後放置到edx寄存器中。
 
其它的Intel格式的符號擴展指令還有:
 
゚     cbw--sign-extendbytein%altowordin%ax;
 
゚     cwde--sign-extendwordin%axtolongin%eax;
 
゚     cwd--sign-extendwordin%axtolongin%dx:%ax;
 
゚     cdq--sign-extenddwordin%eaxtoquadin%edx:%eax;
 
對應的AT&T語法的指令爲cbtw,cwtl,cwtd,cltd。
 
Call and Jump
  
段內調用和跳轉指令爲"call","ret"和"jmp",段間調用和跳轉指令爲"lcall","lret" 和 "ljmp"。
 
段間調用和跳轉指令的格式爲“lcall/ljmp$SECTION,$OFFSET”,而段間返回指令則 爲“lret$STACK-ADJUST”。 
 
Prefix 
 
操作碼前綴被用在下列的情況:
゚     字符串重複操作指令(rep,repne); ゚     指定被操作的段(cs,ds,ss,es,fs,gs); ゚      進行總線加鎖(lock); 
゚     指定地址和操作的大小(data16,addr16);


在AT&T彙編語法中,操作碼前綴通常被單獨放在一行,後面不跟任何操作數。例如, 對於重複scas指令,其寫法爲:
 
repne
 
scas
 
上述操作碼前綴的意義和用法如下:
 
゚     指定被操作的段前綴爲cs,ds,ss,es,fs,和gs。在AT&T  語法中,只需要按照 section:memory-operand 的格式就指定了相應的段前綴。比如: lcall%cs:realmode_swtch
 
゚     操作數/地址大小前綴是“data16”和"addr16",它們被用來在32-bit操作數/地址 代碼中指定16-bit的操作數/地址。
 
゚     總線加鎖前綴“lock”,它是爲了在多處理器環境中,保證在當前指令執行期間禁止 一切中斷。這個前綴僅僅對ADD,ADC,

 

AND,BTC,BTR,BTS,CMPXCHG,DEC, INC,NEG,NOT,OR,SBB,SUB,XOR,XADD,XCHG指令有效,如果將Lock前綴用在其它

 

指令之前,將會引起異常。
 
゚     字符串重複操作前綴"rep","repe","repne"用來讓字符串操作重複“%ecx”次。
 
 
Memory Reference
  
Intel語法的間接內存引用的格式爲:
 
section:[base+index*scale+displacement]
 
而在AT&T語法中對應的形式爲: 
 
section:displacement(base,index,scale)
 
其中,base和index是任意的32-bitbase和index寄存器。scale可以取值1,2,4,8。 如果不指定scale值,則默認值爲1。

 

section可以指定任意的段寄存器作爲段前綴,默認的段寄存器在不同的情況下不一樣。如果你在指令中指定了默認的段前綴,則

 

編譯器在目標代 碼中不會產生此段前綴代碼。
  
下面是一些例子:
 
-4(%ebp):base=%ebp,displacement=-4,section沒有指定,由於base=%ebp,所 以默認的section=%ss,

 

index,scale沒有指定,則index爲0。
 
foo(,%eax,4):index=%eax,scale=4,displacement=foo。其它域沒有指定。這裏默認 的section=%ds。
 
foo(,1):這個表達式引用的是指針foo指向的地址所存放的值。注意這個表達式中沒有base和index,並且只有一個逗號,

 

這是一種異常語法,但卻合法。
 
%gs:foo:這個表達式引用的是放置於%gs段裏變量foo的值。
 
如果call和jump操作在操作數前指定前綴“*”,則表示是一個絕對地址調用/跳轉,也 就是說jmp/call指令指定的是一個

 

絕對地址。如果沒有指定"*",則操作數是一個相對地址。
 
任何指令如果其操作數是一個內存操作,則指令必須指定它的操作尺寸(byte,word,long),也就是說必須帶有指令後綴(b,w,l)。
 
 
2. GCC Inline ASM 
 
GCC  支持在C/C++代碼中嵌入彙編代碼,這些彙編代碼被稱作GCC Inline ASM— — GCC  內聯彙編。這是一個非常有用的功能,

 

有利於我們將一些C/C++語法無法 表達的指令直接潛入C/C++代碼中,另外也允許我們直接寫C/C++代碼中使用匯編編寫簡潔高效

 

的代碼。
 
 
2.1 Essential Inline ASM 
 
GCC中基本的內聯彙編非常易懂,我們先來看兩個簡單的例子:
 
__asm__("movl%esp,%eax"); //看起來很熟悉吧!
 
或者是 
 
__asm__("


movl$1,%eax   //SYS_exit xor%ebx,%ebx
 
int $0x80
");
 
 或
__asm__(
 "movl$1,%eax/r/t"


"xor%ebx,%ebx/r/t"
 
"int$0x80"
 
);
 
 
基本內聯彙編的格式是
 __asm____volatile__("InstructionList");


 1.__asm__
  
__asm__是GCC關鍵字asm的宏定義:
 
#define__asm__asm
 
__asm__或 asm  用來聲明一個內聯彙編表達式,所以任何一個內聯彙編表達式都是以 它開頭的,是必不可少的。
 
 2.InstructionList
 
 InstructionList是彙編指令序列。它可以是空的,比如:__asm__ __volatile__("");  或__asm__("");都是完

 

全合法的內聯彙編表達式,只不過這兩條語句沒有什麼意義。但並非所 有InstructionList爲空的內聯彙編表達式都是

 

沒有意義的,比如:__asm__ ("":::"memory"); 就非常有意義,它向GCC  聲明:"我對內存作了改動",GCC在編譯

 

的時候,會將此因素 考慮進去。
 
我們看一看下面這個例子: 
 
$catexample1.c
 
int main(int__argc,char*__argv[])
 
{
 int*__p=(int*)__argc;


(*__p)=9999;
 
//__asm__("":::"memory");
  
if((*__p)==9999)
return5;
  
return(*__p);
 
}
 
 
在這段代碼中,那條內聯彙編是被註釋掉的。在這條內聯彙編之前,內存指針__p所指 向的內存被賦值爲9999,

 

隨即在內聯彙編之後,一條if語句判斷__p所指向的內存與9999 是否相等。很明顯,它們是相等的。GCC在優化

 

編譯的時候能夠很聰明的發現這一點。我 們使用下面的命令行對其進行編譯:
 
$gcc-O-Sexample1.c
 
 
選項-O表示優化編譯,我們還可以指定優化等級,比如-O2表示優化等級爲2;選項-S
 
表示將 C/C++源文件編譯爲彙編文件,文件名和 C/C++文件一樣,只不過擴展名由.c  變爲.s。
 
我們來查看一下被放在example1.s中的編譯結果,我們這裏僅僅列出了使用gcc 2.96 在redhat7.3上編譯後的相關函數部分彙編代碼。爲了保持清晰性,無關的其它代碼未被列 出。
$catexample1.s main:
pushl %ebp
 
movl   %esp,%ebp
movl   8(%ebp),%eax   #int*__p=(int*)__argc movl    $9999,(%eax)       # (*__p) = 9999
 
movl   $5,%eax        #return5
popl   %ebp ret
 
 
參照一下C源碼和編譯出的彙編代碼,我們會發現彙編代碼中,沒有if語句相關的代 碼,而是在賦值語句(*__p)=9999

 

後直接return5;這是因爲GCC認爲在(*__p)被賦值之後, 在if語句之前沒有任何改變(*__p)內容的操作,所以那條if

 

語句的判斷條件(*__p)==9999 肯定是爲true  的,所以GCC就不再生成相關代碼,而是直接根據爲true的條件生成

 

return 5的彙編代碼(GCC使用eax作爲保存返回值的寄存器)。

 
我們現在將example1.c中內聯彙編的註釋去掉,重新編譯,然後看一下相關的編譯結 果。
 
$gcc-O-Sexample1.c
$catexample1.s main:
 
pushl %ebp
movl   %esp,%ebp
movl   8(%ebp),%eax   #int*__p=(int*)__argc movl $9999,(%eax) # (*__p) = 9999
 
#APP
 
#__asm__("":::"memory")
 
#NO_APP
cmpl   $9999,(%eax)    #(*__p)==9999
 
jne    .L3                      #false
 
movl   $5,%eax           #true,return5
 
jmp    .L2
 
.L3:
movl   (%eax),%eax
 
.L2:
popl   %ebp ret


 
由於內聯彙編語句__asm__("":::"memory")向 GCC  聲明,在此內聯彙編語句出現的位 置內存內容可能了改變,所以GCC  在編譯時就不能像剛纔那樣處理。這次,GCC  老老實 實的將if語句生成了彙編代碼。
 
可能有人會質疑:爲什麼要使用__asm__("":::"memory")向GCC聲明內存發生了變化? 明明“InstructionList”是空的,沒有任何對內存的操作,這樣做只會增加GCC生成彙編代 碼的數量。
 
確實,那條內聯彙編語句沒有對內存作任何操作,事實上它確實什麼都沒有做。但影響 內存內容的不僅僅是你當前正在運行的程序。比如,如果你現在正在操作的內存是一塊內存 映射,映射的內容是外圍I/O設備寄存器。那麼操作這塊內存的就不僅僅是當前的程序,I/O 設備也會去操作這塊內存。既然兩者都會去操作同一塊內存,那麼任何一方在任何時候都不 能對這塊內存的內容想當然。所以當你使用高級語言C/C++寫這類程序的時候,你必須讓 編譯器也能夠明白這一點,畢竟高級語言最終要被編譯爲彙編代碼。
 
你可能已經注意到了,這次輸出的彙編結果中,有兩個符號:#APP和#NO_APP,GCC
 
將內聯彙編語句中"Instruction List"所列出的指令放在#APP  和#NO_APP  之間,由於__asm__("":::"memory")中“InstructionList”爲空,所以#APP和#NO_APP中間也沒有任何 內容。但我們以後的例子會更加清楚的表現這一點。
 
關於爲什麼內聯彙編__asm__("":::"memory")是一條聲明內存改變的語句,我們後面會 詳細討論。
 
剛纔我們花了大量的內容來討論"InstructionList"爲空是的情況,但在實際的編程中,
 
"InstructionList"絕大多數情況下都不是空的。它可以有1條或任意多條彙編指令。
 
當在"InstructionList"中有多條指令的時候,你可以在一對引號中列出全部指令,也可 以將一條或幾條指令放在一對引號中,所有指令放在多對引號中。如果是前者,你可以將每 一條指令放在一行,如果要將多條指令放在一行,則必須用分號(;)或換行符(/n,大多 數情況下/n後還要跟一個/t,其中/n是爲了換行,/t是爲了空出一個tab寬度的空格)將 它們分開。下面的例子都是合法的寫法。
 
__asm__("movl %eax, %ebx sti
popl%edi
 
subl%ecx,%ebx");
 
 __asm__("movl%eax,%ebx;sti popl%edi;subl%ecx,%ebx");
  
__asm__("movl%eax,%ebx;sti/n/tpopl%edi subl%ecx,%ebx");

 
如果你將指令放在多對引號中,則除了最後一對引號之外,前面的所有引號裏的最後一 條指令之後都要有一個分號(;)或(/n)或(/n/t)。比如:
  
__asm__("movl %eax, %ebx sti/n"
 
"popl%edi;"
 
"subl%ecx,%ebx");
 
 
__asm__("movl%eax,%ebx;sti/n/t"
"popl%edi;subl%ecx,%ebx");
 
 
__asm__("movl%eax,%ebx;sti/n/tpopl%edi/n"
 
"subl%ecx,%ebx"); 
 
__asm__("movl%eax,%ebx;sti/n/tpopl%edi;"
 
"subl%ecx,%ebx"); 
 
 
上述原則可以歸結爲:
 
゚     任意兩個指令間要麼被分號(;)分開,要麼被放在兩行;
 
゚     放在兩行的方法既可以從通過/n的方法來實現,也可以真正的放在兩行;
 
゚     可以使用1對或多對引號,每1對引號裏可以放任一多條指令,所有的指令都要被放到引號中。
 
在基本內聯彙編中,“InstructionList”的書寫的格式和你直接在彙編文件中寫非內聯匯 編沒有什麼不同,你可以在其中定義Label,定義對齊(.alignn),定義段(.section name )。 例如:
 
 
__asm__(".align2/n/t"
 
"movl%eax,%ebx/n/t"
 
"test%ebx,%ecx/n/t"
 
"jneerror/n/t"
"sti/n/t"
 
"error:popl%edi/n/t"
 
"subl%ecx,%ebx");
 
 
上面例子的格式是 Linux  內聯代碼常用的格式,非常整齊。也建議大家都使用這種格 式來寫內聯彙編代碼。 
 
3.__volatile__ 
 
__volatile__是GCC關鍵字volatile的宏定義:
 
#define__volatile__volatile
 
__volatile__或 volatile 是可選的,你可以用它也可以不用它。如果你用了它,則是向 GCC聲明“不要動我所寫的InstructionList,我需要原封不動的保留每一條指令”,否則當 你使用了優化選項(-O)進行編譯時,GCC  將會根據自己的判斷決定是否將這個內聯彙編表 達式中的指令優化掉。
 
那麼GCC  判斷的原則是什麼?我不知道(如果有哪位朋友清楚的話,請告訴我)。我 試驗了一下,發現一條內聯彙編語句如果是基本內聯彙編的話(即只有“InstructionList”, 沒有 Input/Output/Clobber 的內聯彙編,我們後面將會討論這一點),無論你是否使用
 
__volatile__來修飾,GCC 2.96  在優化編譯時,都會原封不動的保留內聯彙編中的
“InstructionList”。但或許我的試驗的例子並不充分,所以這一點並不能夠得到保證。 爲了保險起見,如果你不想讓GCC的優化影響你的內聯彙編代碼,你最好在前面都加上__volatile__,而不要依賴於編譯器的原則,因爲即使你非常瞭解當前編譯器的優化原則,
 
你也無法保證這種原則將來不會發生變化。而__volatile__的含義卻是恆定的。
 
 
2.2 Inline ASM with C/C++ Expression
 
 
GCC  允許你通過 C/C++表達式指定內聯彙編中"Instrcuction List"中指令的輸入和輸 出,你甚至可以不關心到底使用哪個寄存器被使用,完全靠GCC來安排和指定。這一點可以讓程序員避免去考慮有限的寄存器的使用,也可以提高目標代碼的效率。先來看幾個例子:
 
 
__asm__("":::"memory"); //前面提到的
 
 
__asm__("mov%%eax,%%ebx"
:"=b"(rv)
 
:"a"(foo)
 
:"eax","ebx");
 
 
__asm____volatile__("lidt%0"
:"=m"(idt_descr));
 
 
__asm__("subl%2,%0/n/t"
 
"sbbl%3,%1"
 
:"=a"(endlow),"=d"(endhigh)
: "g" (startlow), "g" (starthigh),"0"(endlow),"1"(endhigh)); 
 
怎麼樣,有點印象了吧,是不是也有點暈?沒關係,下面討論完之後你就不會再暈了。
 
(當然,也有可能更暈☺)。討論開始——
 
帶有C/C++表達式的內聯彙編格式爲:
 
 
__asm__ __volatile__("InstructionList"
 
:Output
 
:Input
 
:Clobber/Modify);
 
 
從中我們可以看出它和基本內聯彙編的不同之處在於:它多了3個部分(Input,Output,
 
Clobber/Modify)。在括號中的4個部分通過冒號(:)分開。
 
這4個部分都不是必須的,任何一個部分都可以爲空,其規則爲:
 
゚     如果Clobber/Modify  爲空,則其前面的冒號(:)必須省略。比如__asm__("mov
 
%%eax, %%ebx" : "=b"(foo) : "a"(inp) : )就是非法的寫法;而__asm__("mov
 
%%eax,%%ebx":"=b"(foo):"a"(inp))則是正確的。
 
゚     如果InstructionList爲空,則Input,Output,Clobber/Modify可以不爲空,也 可以爲空。比如__asm__("":::"memory");和__asm__(""::);都是合法的寫法。
 
゚     如果Output,Input,Clobber/Modify都爲空,Output,Input之前的冒號(:)既 可以省略,也可以不省略。如果都省略,則此彙編退化爲一個基本內聯彙編,否則, 仍然是一個帶有C/C++表達式的內聯彙編,此時"InstructionList"中的寄存器寫法 要遵守相關規定,比如寄存器前必須使用兩個百分號(%%),而不是像基本彙編格 式一樣在寄存器前只使用一個百分號(%)。比如__asm__( " mov %%eax,
 
%%ebx"::);__asm__("mov%%eax,%%ebx":)和__asm__("mov%eax,%ebx")
 
都是正確的寫法,而__asm__("mov%eax,%ebx"::);__asm__("mov%eax,
 
%ebx":)和__asm__("mov%%eax,%%ebx")都是錯誤的寫法。
 
゚     如果Input,Clobber/Modify爲空,但Output不爲空,Input前的冒號(:)既可以 省略,也可以不省略。比如__asm__( " mov %%eax, %%ebx" : "=b"(foo)  : );
 
__asm__("mov%%eax,%%ebx":"=b"(foo))都是正確的。
 
゚     如果後面的部分不爲空,而前面的部分爲空,則前面的冒號(:)都必須保留,否則無 法說明不爲空的部分究竟是第幾部分。比如,Clobber/Modify,Output  爲空, 而Input不爲空,則Clobber/Modify前的冒號必須省略(前面的規則),而Output 前的冒號必須爲保留。如果Clobber/Modify不爲空,而Input和Output都爲空, 則Input和Output 前的冒號都必須保留。比如__asm__("mov%%eax,%%ebx"::
 
"a"(foo))和__asm__("mov%%eax,%%ebx":::"ebx")。


從上面的規則可以看到另外一個事實,區分一個內聯彙編是基本格式的還是帶有 C/C++表達式格式的,其規則在於在"InstructionList"後是否有冒號(:)的存在,如果沒有則 是基本格式的,否則,則是帶有C/C++表達式格式的。
 
兩種格式對寄存器語法的要求不同:基本格式要求寄存器前只能使用一個百分號(%), 這一點和非內聯彙編相同;而帶有C/C++表達式格式則要求寄存器前必須使用兩個百分號
 
(%%),其原因我們會在後面討論。
 
 
1.Output
 
 
 
Output用來指定當前內聯彙編語句的輸出。我們看一看這個例子:
 
__asm__("movl%%cr0,%0":"=a"(cr0));
 
這個內聯彙編語句的輸出部分爲"=r"(cr0),它是一個“操作表達式”,指定了一個輸出操 作。我們可以很清楚得看到這個輸出操作由兩部分組成:括號裏的部分(cr0)和引號引住的部 分"=a"。這兩部分都是每一個輸出操作必不可少的。括號裏的部分是一個C/C++表達式, 用來保存內聯彙編的一個輸出值,其操作就等於C/C++的相等賦值cr0=output_value, 因此,括號中的輸出表達式只能是C/C++的左值表達式,也就是說它只能是一個可以合法 的放在C/C++賦值操作中等號(=)左邊的表達式。那麼右值output_value從何而來呢?
 
答案是引號中的內容,被稱作“操作約束”(OperationConstraint),在這個例子中操 作約束爲"=a",它包含兩個約束:等號(=)和字母a,其中等號(=)說明括號中左值表達式cr0 是一個Write-Only的,只能夠被作爲當前內聯彙編的輸入,而不能作爲輸入。而字母a是 寄存器EAX/AX/AL的簡寫,說明cr0的值要從eax寄存器中獲取,也就是說cr0=eax, 最終這一點被轉化成彙編指令就是movl%eax,address_of_cr0。現在你應該清楚了吧,操 作約束中會給出:到底從哪個寄存器傳遞值給cr0。
 
另外,需要特別說明的是,很多文檔都聲明,所有輸出操作的操作約束必須包含一個等號(=),但GCC的文檔中卻很清楚的聲明,並非如此。因爲等號(=)約束說明當前的表達式 是一個Write-Only的,但另外還有一個符號— — 加號(+)用來說明當前表達式是一個
Read-Write的,如果一個操作約束中沒有給出這兩個符號中的任何一個,則說明當前表達式是Read-Only的。因爲對於輸出操作來說,肯定是必須是可寫的,而等號(=)和加號(+) 都表示可寫,只不過加號(+)同時也表示是可讀的。所以對於一個輸出操作來說,其操作約 束只需要有等號(=)或加號(+)中的任意一個就可以了。
 
二者的區別是:等號(=)表示當前操作表達式指定了一個純粹的輸出操作,而加號(+)則 表示當前操作表達式不僅僅只是一個輸出操作還是一個輸入操作。但無論是等號(=)約束還 是加號(+)約束所約束的操作表達式都只能放在Output域中,而不能被用在Input域中。
 
另外,有些文檔聲明:儘管GCC文檔中提供了加號(+)約束,但在實際的編譯中通不過;我不知道老版本會怎麼樣,我在GCC2.96中對加號(+)約束的使用非常正常。


 
我們通過一個例子看一下,在一個輸出操作中使用等號(=)約束和加號(+)約束的不同。
 
 
$catexample2.c
 
 
intmain(int__argc,char*__argv[])
 
{
 
intcr0=5;
__asm____volatile__("movl%%cr0,%0"
 
:"=a"(cr0));
 
 
return0;
 
}
 
 
$gcc-Sexample2.c
 
 
$catexample2.s main:
pushl %ebp
movl   %esp, %ebp subl    $4,%esp
 
movl   $5, -4(%ebp)     #cr0=5
 
#APP
movl%cr0,%eax
 
#NO_APP
 
movl   %eax,%eax
movl   %eax,-4(%ebp)   #cr0=%eax movl $0,%eax
leave ret
 
 
這個例子是使用等號(=)約束的情況,變量 cr0  被放在內存-4(%ebp)的位置,所以指令
 
mov %eax,-4(%ebp)即表示將%eax的內容輸出到變量cr0中。
 
下面是使用加號(+)約束的情況:
 
 
$catexample3.c
 
intmain(int__argc,char*__argv[])
 
{
 
intcr0=5;
 
__asm____volatile__("movl%%cr0,%0"
:"+a"(cr0));
 
return0;
 
}


 
 
$gcc-Sexample3.c
$catexample3.s main:
 
pushl %ebp
movl   %esp,%ebp subl   $4,%esp
 
movl   $5, -4(%ebp)        #cr0= 5
 
movl    -4(%ebp),%eax      #input(%eax=cr0)
 
#APP
movl   %cr0,%eax
 
#NO_APP
 
movl   %eax,-4(%ebp)      #output(cr0=%eax)
movl   $0,%eax leave
ret
 
從編譯的結果可以看出,當使用加號(+)約束的時候,cr0不僅作爲輸出,還作爲輸入, 所使用寄存器都是寄存器約束(字母a,表示使用eax寄存器)指定的。關於寄存器約束我們 後面討論。
 
在Output域中可以有多個輸出操作表達式,多個操作表達式中間必須用逗號(,)分開。 例如:
 
 
$catexample3.c
__asm__(
 
"movl   %%eax, %0/n/t"
 
"pushl %%ebx/n/t"
 
"popl    %1/n/t"
 
"movl   %1,%2"
:"+a"(cr0),"=b"(cr1),"=c"(cr2));
 
 
 
2.Input
 
 
 
Input域的內容用來指定當前內聯彙編語句的輸入。我們看一看這個例子:
 
 
__asm__("movl %0, %%db7"::"a"(cpu->db7));
 
例中 Input  域的內容爲一個表達式"a"[cpu->db7),被稱作“輸入表達式”,用來表示一 個對當前內聯彙編的輸入。
 
像輸出表達式一樣,一個輸入表達式也分爲兩部分:帶括號的部分(cpu->db7)和帶引號 的部分"a"。這兩部分對於一個內聯彙編輸入表達式來說也是必不可少的。


 
括號中的表達式cpu->db7是一個C/C++語言的表達式,它不必是一個左值表達式, 也就是說它不僅可以是放在C/C++賦值操作左邊的表達式,還可以是放在C/C++賦值操作 右邊的表達式。所以它可以是一個變量,一個數字,還可以是一個複雜的表達式(比如 a+b/c*d)。比如上例可以改爲:
 
__asm__("movl %0, %%db7": : "a" (foo));
 
__asm__("movl %0, %%db7": : "a" (0x1000));
__asm__("movl %0, %%db7"::"a"(va*vb/vc));
引號號中的部分是約束部分,和輸出表達式約束不同的是,它不允許指定加號(+)約束 和等號(=)約束,也就是說它只能是默認的Read-Only的。約束中必須指定一個寄存器約束, 例中的字母a表示當前輸入變量cpu->db7要通過寄存器eax輸入到當前內聯彙編中。
 
我們看一個例子:
 
 
$catexample4.c
 
intmain(int__argc,char*__argv[])
 
{
intcr0 =5;
 
__asm____volatile__("movl%0,%%cr0"::"a"(cr0));
 
return0;
 
}
 
$gcc-Sexample4.c
$catexample4.s main:
 
pushl %ebp
movl   %esp,%ebp subl   $4,%esp
movl   $5, -4(%ebp)          #cr0=5
 
movl    -4(%ebp),%eax     #%eax=cr0
 
#APP
 
movl   %eax,%cr0
 
#NO_APP
movl   $0,%eax leave
 
ret
 
我們從編譯出的彙編代碼可以看到,在"InstructionList"之前,GCC按照我們的輸入約 束"a",將變量cr0的內容裝入了eax寄存器。
 
 
3.OperationConstraint
 
 
每一個Input和Output表達式都必須指定自己的操作約束Operation Constraint,我 們這裏來討論在80386平臺上所可能使用的操作約束。


16                                                                                                     Developing Your OwnUnix-LikeOS on IBM PC
 
 
 
3.1 Register Constraint
 
當你當前的輸入或輸入需要藉助一個寄存器時,你需要爲其指定一個寄存器約束。你可 以直接指定一個寄存器的名字,比如:
 
 
__asm____volatile__("movl%0,%%cr0"::"eax"(cr0));
 
也可以指定一個縮寫,比如:
 
__asm____volatile__("movl%0,%%cr0"::"a"(cr0));
 
如果你指定一個縮寫,比如字母a,則GCC將會根據當前操作表達式中C/C++表達式 的寬度決定使用%eax,還是%ax或%al。比如:
 
 
unsignedshort__shrt;
__asm__("mov%0,%%bx"::"a"(__shrt));
 
 
由於變量__shrt是16-bitshort類型,則編譯出來的彙編代碼中,會讓變量__shrt使用
 
%ex寄存器。編譯結果爲:
 
 
Movw   -2(%ebp),%ax #%ax=__shrt
#APP
 
movl   %ax,%bx
 
#NO_APP
 
 
無論是Input,還是Output操作表達式約束,都可以使用寄存器約束。
 
下表中列出了常用的寄存器約束的縮寫。
 
 
約束       意義
 
r                    表示使用一個通用寄存器,由 GCC  在%eax/%ax/%al,%ebx/%bx/%bl,
 
%ecx/%cx/%cl,%edx/%dx/%dl中選取一個GCC認爲合適的。
 
g                   表示使用任意一個寄存器,由GCC在所有的可以使用的寄存器中選取一個
 
GCC認爲合適的。
 
q                   表示使用一個通用寄存器,和約束r的意義相同。
 
a                   表示使用%eax/%ax/%al
 
b                   表示使用%ebx/%bx/%bl
 
c                    表示使用%ecx/%cx/%cl
 
d                   表示使用%edx/%dx/%dl
 
D                  表示使用%edi/%di
 
S                   表示使用%esi/%si
 
f                    表示使用浮點寄存器
 
t                    表示使用第一個浮點寄存器
 
u                   表示使用第二個浮點寄存器


 
3.2 Memory Constraint
 
如果一個Input/Output  操作表達式的C/C++表達式表現爲一個內存地址,不想借助 於任何寄存器,則可以使用內存約束。比如:
 
 
__asm__("lidt%0":"=m"(__idt_addr));
__asm__("lidt%0"::"m"(__idt_addr));
 
 
我們看一下它們分別被放在一個C源文件中,然後被GCC編譯後的結果:
 
 
$catexample5.c
/*本例中,變量__sh被作爲一個內存輸入*/
 
intmain(int__argc,char*__argv[])
 
{
 
char*__sh=(char*)&__argc;
 
 
__asm____volatile__(
 
"lidt%0"
 
:/*nooutput*/
 
:"m"(__sh)
 
);
 
 
return0;
 
}
 
 
$gcc-Sexample5.c
 
 
$catexample5.s main:
 
pushl %ebp
movl   %esp,%ebp subl   $4,%esp
 
leal    8(%ebp),%eax
 
movl   %eax,-4(%ebp) #sh=(char*)&__argc
 
#APP
 
lidt      -4(%ebp)
#NO_APP
movl   $0,%eax leave
 
ret


 
 
$catexample6.c
/*本例中,變量__sh被作爲一個內存輸出*/
intmain(int__argc,char*__argv[])
 
{
 
char*__sh=(char*)&__argc;
 
 
__asm____volatile__(
"lidt%0"
 
:"=m"(__sh)
 
);
 
 
return0;
}
 
 
$gcc-Sexample6.c
 
 
$catexample6.s main:
 
pushl %ebp
movl   %esp,%ebp subl $4,%esp
 
leal   8(%ebp),%eax
movl   %eax,-4(%ebp) # sh = (char*) &__argc
 
#APP
 
lidt   -4(%ebp)
 
#NO_APP
movl   $0,%eax leave
 
ret
 
首先,你會注意到,在這兩個例子中,變量sh沒有藉助任何寄存器,而是直接參與了 指令lidt的操作。
 
其次,通過仔細觀察,你會發現一個驚人的事實,兩個例子編譯出來的彙編代碼是一樣 的!雖然,一個例子中變量sh作爲輸入,而另一個例子中變量sh作爲輸出。這是怎麼回事?
 
原來,使用內存方式進行輸入輸出時,由於不借助寄存器,所以GCC不會按照你的聲 明對其作任何的輸入輸出處理。GCC只會直接拿來用,究竟對這個C/C++表達式而言是輸 入還是輸出,完全依賴與你寫在"InstructionList"中的指令對其操作的指令。
 
由於上例中,對其操作的指令爲lidt,lidt指令的操作數是一個輸入型的操作數,所以 事實上對變量sh的操作是一個輸入操作,即使你把它放在Output  域也不會改變這一點。 所以,對此例而言,完全符合語意的寫法應該是將sh放在Input域,儘管放在Output域 也會有正確的執行結果。


 
所以,對於內存約束類型的操作表達式而言,放在Input域還是放在Output域,對編 譯結果是沒有任何影響的,因爲本來我們將一個操作表達式放在Input域或放在Output域 是希望GCC能爲我們自動通過寄存器將表達式的值輸入或輸出。既然對於內存約束類型的 操作表達式來說,GCC  不會自動爲它做任何事情,那麼放在哪兒也就無所謂了。但從程序 員的角度而言,爲了增強代碼的可讀性,最好能夠把它放在符合實際情況的地方。
 
 
約束       意義
 
M                  表示使用系統所支持的任何一種內存方式,不需要藉助寄存器。
 
3.3 ImmediatelyNumberConstraint
 
如果一個Input/Output  操作表達式的C/C++表達式是一個數字常數,不想藉助於任 何寄存器,則可以使用立即數約束。
 
由於立即數在C/C++中只能作爲右值,所以對於使用立即數約束的表達式而言,只能 放在Input域。比如:
 
 
__asm____volatile__("movl%0,%%eax"::"i"(100));
 
立即數約束很簡單,也很容易理解,我們在這裏就不再贅述。
 
 
約束       意義
 
i                    表示輸入表達式是一個立即數(整數),不需要藉助任何寄存器。
 
F                   表示輸入表達式是一個立即數(浮點數),不需要藉助任何寄存器。
 
 
 
 
3.4 Generic Constraint
 
 
約束       輸入/輸出       意義
g                   I,O                         表示可以使用通用寄存器,內存,立即數等任何一種處理方式。
 
0-9                I                             表示和第n個操作表達式使用相同的寄存器/內存。
 
通用約束g是一個非常靈活的約束,當程序員認爲一個C/C++表達式在實際的操作中, 究竟使用寄存器方式,還是使用內存方式或立即數方式並無所謂時,或者程序員想實現一個靈活的模板,讓GCC可以根據不同的C/C++表達式生成不同的訪問方式時,就可以使用 通用約束g。比如:
 
 
#defineJUST_MOV(foo)    /
 
__asm__("movl%0,%%eax"::"g"(foo))
 
 
JUST_MOV(100)和JUST_MOV(var)則會讓編譯器產生不同的代碼。


 
 
 
intmain(int__argc,char*__argv[])
 
{
 
JUST_MOV(100);
 
return0;
}
 
 
編譯後生成的代碼爲:
 
 
main:
pushl %ebp
 
movl   %esp,%ebp
 
#APP
 
movl$100,%eax
 
#NO_APP
movl   $0,%eax popl %ebp
 
ret
 
很明顯這是立即數方式。而下一個例子:
 
 
intmain(int__argc,char*__argv[])
 
{
JUST_MOV(__argc);
 
return0;
 
}
 
 
經編譯後生成的代碼爲:
 
 
main:
 
pushl %ebp
 
movl   %esp,%ebp
 
#APP
movl   8(%ebp),%eax
 
#NO_APP
movl   $0,%eax popl   %ebp
 
ret
 
 
這個例子是使用內存方式。
 
一個帶有C/C++表達式的內聯彙編,其操作表達式被按照被列出的順序編號,第一個 是0,第2個是1,依次類推,GCC最多允許有10個操作表達式。比如:


 
 
__asm__("popl%0/n/t"
 
"movl%1,%%esi/n/t"
 
"movl%2,%%edi/n/t"
 
:"=a"(__out)
:"r"(__in1),"r"(__in2));
 
 
此例中,__out所在的Output操作表達式被編號爲0,"r"(__in1)被編號爲1,"r"(__in2)
 
被編號爲2。
 
再如:
 
 
__asm__("movl%%eax,%%ebx"::"a"(__in1),"b"(__in2));
 
此例中,"a"(__in1)被編號爲0,"b"(__in2)被編號爲1。
 
如果某個Input操作表達式使用數字0到9中的一個數字(假設爲1)作爲它的操作約 束,則等於向GCC聲明:“我要使用和編號爲1的Output操作表達式相同的寄存器(如果 Output操作表達式1使用的是寄存器),或相同的內存地址(如果Output操作表達式1使 用的是內存)”。上面的描述包含兩個限定:數字0到數字9作爲操作約束只能用在Input 操作表達式中,被指定的操作表達式(比如某個Input操作表達式使用數字1作爲約束,那 麼被指定的就是編號爲1的操作表達式)只能是Output操作表達式。
 
由於GCC規定最多只能有10個Input/Output操作表達式,所以事實上數字9作爲操 作約束永遠也用不到,因爲Output操作表達式排在Input操作表達式的前面,那麼如果有一個Input操作表達式指定了數字9作爲操作約束的話,那麼說明Output操作表達式的數 量已經至少爲10個了,那麼再加上這個Input  操作表達式,則至少爲11個了,以及超出 GCC的限制。
 
5、Modifier Characters(修飾符)
 
等號(=)和加號(+)用於對Output操作表達式的修飾,一個Output操作表達式要麼被等 號(=)修飾,要麼被加號(+)修飾,二者必居其一。使用等號(=)說明此Output操作表達式是 Write-Only的,使用加號(+)說明此Output操作表達式是Read-Write的。它們必須被放在 約束字符串的第一個字母。比如"a="(foo)是非法的,而"+g"(foo)則是合法的。
 
當使用加號(+)的時候,此Output  表達式等價於使用等號(=)約束加上一個Input  表達 式。比如
 
__asm__("movl%0,%%eax;addl%%eax,%0": "+b"(foo))
 
 
等價於
 
 
__asm__("movl%0,%%eax;addl%%eax,%0":"+b"(foo))
 
但如果使用後一種寫法,"InstructionList"中的別名也要相應的改動。關於別名,我們


 
後面會討論。
 
像等號(=)和加號(+)修飾符一樣,符號(&)也只能用於對Output操作表達式的修飾。當 使用它進行修飾時,等於向GCC聲明:"GCC不得爲任何Input操作表達式分配與此Output 操作表達式相同的寄存器"。其原因是&修飾符意味着被其修飾的Output操作表達式要在所 有的Input操作表達式被輸入前輸出。我們看下面這個例子:
 
 
intmain(int__argc,char*__argv[])
 
{
 
int__in1=8,__in2=4,__out=3;
 
 
__asm__("popl%0/n/t"
"movl%1,%%esi/n/t"
 
"movl%2,%%edi/n/t"
 
:"=a"(__out)
 
:"r"(__in1),"r"(__in2));
 
 
return0;
 
}
 
此例中,%0  對應的就是Output  操作表達式,它被指定的寄存器是%eax,整個 InstructionList的第一條指令popl%0,編譯後就成爲popl%eax,這時%eax的內容已經 被修改,隨後在InstructionList後,GCC會通過movl%eax,address_of_out  這條指令將
%eax的內容放置到Output變量__out中。對於本例中的兩個Input操作表達式而言,它們 的寄存器約束爲"r",即要求GCC爲其指定合適的寄存器,然後在Instruction List之前將
__in1和__in2的內容放入被選出的寄存器中,如果它們中的一個選擇了已經被__out  指定的 寄存器%eax,假如是__in1,那麼GCC  在Instruction List  之前會插入指令movl address_of_in1,%eax,那麼隨後popl%eax指令就修改了%eax的值,此時%eax中存放的 已經不是Input變量__in1的值了,那麼隨後的movl%1,%%esi指令,將不會按照我們的 本意— — 即將__in1的值放入%esi中— — 而是將__out的值放入%esi中了。
 
下面就是本例的編譯結果,很明顯,GCC爲__in2選擇了和__out相同的寄存器%eax, 這與我們的初衷不符。
 
main:
 
pushl %ebp
movl   %esp,%ebp subl   $12,%esp movl       $8, -4(%ebp) movl $4, -8(%ebp) movl       $3, -12(%ebp)
movl    -4(%ebp),%edx      #__in1使用寄存器%edx movl -8(%ebp),%eax        #__in2使用寄存器%eax

 
#APP
 
popl   %eax
movl   %edx,%esi movl %eax,%edi
 
#NO_APP
 
movl   %eax,%eax
movl   %eax,-12(%ebp)   #__out使用寄存器%eax movl $0,%eax
 
leave
 
爲了避免這種情況,我們必須向GCC聲明這一點,要求GCC爲所有的Input操作表 達式指定別的寄存器,方法就是在Output操作表達式"=a"(__out)的操作約束中加入&約束, 由於GCC規定等號(=)約束必須放在第一個,所以我們寫作"=&a"(__out)。
 
下面是我們將&約束加入之後編譯的結果:
 
main:
 
pushl %ebp
movl   %esp,%ebp subl $12,%esp movl       $8,-4(%ebp) movl   $4,-8(%ebp) movl   $3,-12(%ebp)
movl   -4(%ebp),%edx    #__in1使用寄存器%edx movl   -8(%ebp),%eax
movl   %eax,%ecx       #__in2使用寄存器%ecx
 
#APP
 
popl   %eax
movl   %edx,%esi movl %ecx,%edi
#NO_APP
 
movl   %eax,%eax
movl   %eax,-12(%ebp)   #__out使用寄存器%eax movl   $0,%eax
leave ret
 
 
 
OK!這下好了,完全與我們的意圖吻合。
 
如果一個Output操作表達式的寄存器約束被指定爲某個寄存器,只有當至少存在一個 Input  操作表達式的寄存器約束爲可選約束時,(可選約束的意思是可以從多個寄存器中選 取一個,或使用非寄存器方式),比如"r"或"g"時,此Output操作表達式使用&修飾纔有意 義。如果你爲所有的Input操作表達式指定了固定的寄存器,或使用內存/立即數約束,則 此Output操作表達式使用&修飾沒有任何意義。比如:

 
__asm__("popl%0/n/t"
 
"movl%1,%%esi/n/t"
 
"movl%2,%%edi/n/t"
 
:"=&a"(__out)
:"m"(__in1),"c"(__in2));
 
 
此例中的Output操作表達式完全沒有必要使用&來修飾,因爲__in1和__in2都被指定 了固定的寄存器,或使用了內存方式,GCC無從選擇。
 
但如果你已經爲某個Output操作表達式指定了&修飾,並指定了某個固定的寄存器, 你就不能再爲任何Input操作表達式指定這個寄存器,否則會出現編譯錯誤。比如:
 
 
__asm__("popl%0/n/t"
 
"movl%1,%%esi/n/t"
"movl%2,%%edi/n/t"
 
:"=&a"(__out)
 
:"a"(__in1),"c"(__in2));
 
 
本例中,由於__out已經指定了寄存器%eax,同時使用了符號&修飾,則再爲__in1指 定寄存器%eax就是非法的。
 
反過來,你也可以爲Output  指定可選約束,比如"r","g"等,讓GCC爲其選擇到底使 用哪個寄存器,還是使用內存方式,GCC在選擇的時候,會首先排除掉已經被Input操作 表達式使用的所有寄存器,然後在剩下的寄存器中選擇,或乾脆使用內存方式。比如:
 
 
__asm__("popl%0/n/t"
 
"movl%1,%%esi/n/t"
 
"movl%2,%%edi/n/t"
 
:"=&r"(__out)
: "a" (__in1), "c"(__in2));
 
 
 
本例中,由於__out指定了約束"r",即讓GCC爲其決定使用哪一格寄存器,而寄存器
 
%eax和%ecx已經被__in1和__in2使用,那麼GCC在爲__out選擇的時候,只會在%ebx
 
和%edx中選擇。
 
前3個修飾符只能用在Output  操作表達式中,而百分號[%]修飾符恰恰相反,只能用 在Input操作表達式中,用於向GCC聲明:“當前Input操作表達式中的C/C++表達式可 以和下一個Input操作表達式中的C/C++表達式互換”。這個修飾符號一般用於符合交換律 運算,比如加(+),乘(*),與(&),或(|)等等。我們看一個例子:


 
 
intmain(int__argc,char*__argv[])
 
{
 
int__in1=8,__in2=4,__out=3;
 
 
__asm__("addl%1,%0/n/t"
 
:"=r"(__out)
 
:"%r"(__in1),"0"(__in2));
 
 
return0;
}
 
 
在此例中,由於指令是一個加法運算,相當於等式__out=__in1+__in2,而它與等式
__out=__in2+__in1沒有什麼不同。所以使用百分號修飾,讓GCC知道__in1和__in2可 以互換,也就是說GCC可以自動將本例的內聯彙編改變爲:
 
 
__asm__("addl%1,%0/n/t"
:"=r"(__out)
 
:"%r"(__in2),"0"(__in1));
 
 
 
下表總結了各種修飾符的意義:
 
 
修飾符     輸入/輸出      意義
 
=                   O                        表示此Output操作表達式是Write-Only的。
 
+                   O                        表示此Output操作表達式是Read-Write的。
 
&                  O                        表示此Output操作表達式獨佔爲其指定的寄存器。
%                  I                          表示此Input  操作表達式中的C/C++表達式可以和下一 個Input操作表達式中的C/C++表達式互換。
 
 
4.  佔位符
 
 
 
什麼叫佔位符?我們看一看下面這個例子:
 
__asm__("addl%1,%0/n/t"
 
:"=a"(__out)
 
:"m"(__in1),"a"(__in2));
 
這個例子中的%0和%1就是佔位符。每一個佔位符對應一個Input/Output操作表達式。 我們在之前已經提到,GCC規定一個內聯彙編語句最多可以有10個Input/Output操作表 達式,然後按照它們被列出的順序依次賦予編號0到9。對於佔位符中的數字而言,和這些 編號是對應的。
 
由於佔位符前面使用一個百分號(%),爲了區別佔位符和寄存器,GCC  規定在帶有


 
C/C++表達式的內聯彙編中,"InstructionList"中直接寫出的寄存器前必須使用兩個百分號
 
(%%)。
 
GCC對其進行編譯的時候,會將每一個佔位符替換爲對應的Input/Output  操作表達 式所指定的寄存器/內存地址/立即數。比如在上例中,佔位符%0對應Output操作表達式
 
"=a"(__out),而"=a"(__out)指定的寄存器爲%eax,所以把佔位符%0  替換爲%eax,佔位符
 
%1對應Input  操作表達式"m"(__in1),而"m"(__in1)被指定爲內存操作,所以把佔位符%1
 
替換爲變量__in1的內存地址。
 
也許有人認爲,在上面這個例子中,完全可以不使用%0,而是直接寫%%eax,就像這 樣:
 
__asm__("addl%1,%%eax/n/t"
 
: "=a"(__out)
 
:"m"(__in1),"a"(__in2));
 
和上面使用佔位符%0  沒有什麼不同,那麼使用佔位符%0  就沒有什麼意義。確實,兩 者生成的代碼完全相同,但這並不意味着這種情況下佔位符沒有意義。因爲如果不使用佔位符,那麼當有一天你想把變量__out的寄存器約束由a改爲b時,那麼你也必須將addl指 令中的%%eax改爲%%ebx,也就是說你需要同時修改兩個地方,而如果你使用佔位符,你 只需要修改一次就夠了。另外,如果你不使用佔位符,將不利於代碼的清晰性。在上例中,如果你使用佔位符,那麼你一眼就可以得知,addl  指令的第二個操作數內容最終會輸出到 變量__out中;否則,如果你不用佔位符,而是直接將addl指令的第2個操作數寫爲%%eax, 那麼你需要考慮一下才知道它最終需要輸出到變量__out中。這是佔位符最粗淺的意義。畢 竟在這種情況下,你完全可以不用。
 
但對於這些情況來說,不用佔位符就完全不行了:
 
首先,我們看一看上例中的第1個Input操作表達式"m"(__in1),它被GCC替換之後, 表現爲addladdress_of_in1,%%eax,__in1的地址是什麼?編譯時才知道。所以我們完全 無法直接在指令中去寫出__in1的地址,這時使用佔位符,交給GCC在編譯時進行替代, 就可以解決這個問題。所以這種情況下,我們必須使用佔位符。
 
其次,如果上例中的Output  操作表達式"=a"(__out)改爲"=r"(__out),那麼__out  在究 竟使用那麼寄存器只有到編譯時才能通過GCC來決定,既然在我們寫代碼的時候,我們不 知道究竟哪個寄存器被選擇,我們也就不能直接在指令中寫出寄存器的名稱,而只能通過佔位符替代來解決。
 
 
 
5.Clobber/Modify
 
 
有時候,你想通知GCC當前內聯彙編語句可能會對某些寄存器或內存進行修改,希望 GCC在編譯時能夠將這一點考慮進去。那麼你就可以在Clobber/Modify  域聲明這些寄存 器或內存。


 
這種情況一般發生在一個寄存器出現在"Instruction List",但卻不是由 Input/Output 操作表達式所指定的,也不是在一些 Input/Output  操作表達式使用"r","g"約束時由 GCC 爲其選擇的,同時此寄存器被"InstructionList"中的指令修改,而這個寄存器只是供當前內 聯彙編臨時使用的情況。比如:
 
 
__asm__("movl%0,%%ebx"::"a"(__foo):"bx");
 
寄存器%ebx  出現在"Instruction List  中",並且被movl  指令修改,但卻未被任何 Input/Output操作表達式指定,所以你需要在Clobber/Modify域指定"bx",以讓GCC知 道這一點。
 
因爲你在Input/Output操作表達式所指定的寄存器,或當你爲一些Input/Output操 作表達式使用"r","g"約束,讓GCC爲你選擇一個寄存器時,GCC對這些寄存器是非常清楚 的— — 它知道這些寄存器是被修改的,你根本不需要在Clobber/Modify域再聲明它們。但 除此之外,GCC  對剩下的寄存器中哪些會被當前的內聯彙編修改一無所知。所以如果你真 的在當前內聯彙編指令中修改了它們,那麼就最好在Clobber/Modify中聲明它們,讓GCC 針對這些寄存器做相應的處理。否則有可能會造成寄存器的不一致,從而造成程序執行錯誤。
 
在Clobber/Modify域中指定這些寄存器的方法很簡單,你只需要將寄存器的名字使用雙引號("")引起來。如果有多個寄存器需要聲明,你需要在任意兩個聲明之間用逗號隔開。 比如:
 
__asm__("movl%0,%%ebx;popl%%ecx"
 
:/*nooutput*/
 
:"a"(__foo):"bx","cx");
 
這些串包括:
 
 
聲明的串                  代表的寄存器
 
"al","ax","eax"                              %eax
 
"bl","bx","ebx"                             %ebx
 
"cl","cx","ecx"                               %ecx
 
"dl","dx","edx"                             %edx
 
"si","esi"                                      %esi
 
"di","edi"                                    %edi
 
由上表可以看出,你只需要使用"ax","bx","cx","dx","si","di"就可以了,因爲其它的都和 它們中的一個是等價的。
 
如果你在一個內聯彙編語句的Clobber/Modify域向GCC聲明某個寄存器內容發生了 改變,GCC  在編譯時,如果發現這個被聲明的寄存器的內容在此內聯彙編語句之後還要繼 續使用,那麼GCC會首先將此寄存器的內容保存起來,然後在此內聯彙編語句的相關生成 代碼之後,再將其內容恢復。我們來看兩個例子,然後對比一下它們之間的區別。


 
這個例子中聲明瞭寄存器%ebx內容發生了改變:
 
$catexample7.c
 
intmain(int__argc,char*__argv[])
 
{
intin=8;
 
__asm__("addl%0,%%ebx"
 
:/*nooutput*/
 
:"a"(in):"bx");
 
 
return0;
 
}
 
$gcc-O-Sexample7.c
$catexample7.s main:
pushl %ebp
 
movl   %esp,%ebp
pushl %ebx       #%ebx內容被保存
 
movl   $8,%eax
 
#APP
addl   %eax,%ebx
 
#NO_APP
 
movl   $0,%eax
movl   (%esp),%ebx     #%ebx內容被恢復
leave ret
 
下面這個例子的C源碼與上一個例子除了沒有聲明%ebx寄存器發生了改變之外,其它 都相同。
 
 
$catexample8.c
 
intmain(int__argc,char*__argv[])
 
{
 
intin=8;
 
 
__asm__("addl%0,%%ebx"
 
:/*nooutput*/
 
:"a"(in));
 
 
return0;
}


 
 
$ gcc-O-Sexample8.c
$catexample8.s main:
 
pushl %ebp
movl   %esp,%ebp movl   $8,%eax
 
#APP
 
addl%eax,%ebx
 
#NO_APP
movl   $0,%eax popl %ebp
 
ret
 
仔細對比一下example7.s和example8.s,你就會明白在Clobber/Modify域聲明一個 寄存器的意義。
 
另外需要注意的是,如果你在Clobber/Modify域聲明瞭一個寄存器,那麼這個寄存器 將不能再被用做當前內聯彙編語句的Input/Output  操作表達式的寄存器約束,如果 Input/Output  操作表達式的寄存器約束被指定爲"r"或"g",GCC也不會選擇已經被聲明在 Clobber/Modify中的寄存器。比如:
 
__asm__("movl%0,%%ebx"
::"a"(__foo):"ax","bx");
 
 
此例中,由於Output操作表達式"a"(__foo)的寄存器約束已經指定了%eax寄存器,那 麼再在Clobber/Modify域中指定"ax"就是非法的。編譯時,GCC會給出編譯錯誤。
 
除了寄存器的內容會被改變,內存的內容也可以被修改。如果一個內聯彙編語句
"InstructionList"中的指令對內存進行了修改,或者在此內聯彙編出現的地方內存內容可能發生改變,而被改變的內存地址你沒有在其Output  操作表達式使用"m"約束,這種情況下 你需要使用在Clobber/Modify域使用字符串"memory"向GCC聲明:“在這裏,內存發生 了,或可能發生了改變”。例如:
 
 
void*memset(void*__s,char__c,size_t__count)
{
 
__asm__("cld/n/t"
 
"rep/n/t"
 
"stosb"
 
:/*nooutput*/
:"a"(__c),"D"(__s),"c"(__count)
 
:"cx","di","memory");
 
return__s;
 
}


此例實現了標準函數庫memset,其內聯彙編中的stosb對內存進行了改動,而其被修 改的內存地址s被指定裝入%edi,沒有任何Output操作表達式使用了"m"約束,以指定內 存地址s處的內容發生了改變。所以在其Clobber/Modify域使用"memory"向GCC聲明: 內存內容發生了變動。
 
如果一個內聯彙編語句的Clobber/Modify域存在"memory",那麼GCC會保證在此內 聯彙編之前,如果某個內存的內容被裝入了寄存器,那麼在這個內聯彙編之後,如果需要使 用這個內存處的內容,就會直接到這個內存處重新讀取,而不是使用被存放在寄存器中的拷 貝。因爲這個時候寄存器中的拷貝已經很可能和內存處的內容不一致了。
 
 
這只是使用"memory"時,GCC  會保證做到的一點,但這並不是全部。因爲使用
"memory"是向GCC  聲明內存發生了變化,而內存發生變化帶來的影響並不止這一點。比 如我們在前面講到的例子:
 
 
intmain(int__argc,char*__argv[])
 
{
 
int* __p = (int*)__argc;
 
(*__p)=9999;
 
__asm__("":::"memory");
if((*__p)==9999)
 
return5;
 
 
return(*__p);
 
}
 
 
本例中,如果沒有那條內聯彙編語句,那個if語句的判斷條件就完全是一句廢話。GCC 在優化時會意識到這一點,而直接只生成return  5的彙編代碼,而不會再生成if語句的相 關代碼,而不會生成return(*__p)的相關代碼。但你加上了這條內聯彙編語句,它除了聲明 內存變化之外,什麼都沒有做。但GCC此時就不能簡單的認爲它不需要判斷都知道(*__p) 一定與9999相等,它只有老老實實生成這條if語句的彙編代碼,一起相關的兩個return語 句相關代碼。
 
當一個內聯彙編指令中包含影響eflags寄存器中的條件標誌(也就是那些Jxx等跳轉指 令要參考的標誌位,比如,進位標誌,0標誌等),那麼需要在Clobber/Modify域中使用"cc" 來聲明這一點。這些指令包括adc,div,popfl,btr,bts等等,另外,當包含call指令時, 由於你不知道你所call的函數是否會修改條件標誌,爲了穩妥起見,最好也使用"cc"。
 
我很少在相關資料中看到有關"cc"的確切用法,只有一份文檔提到了它,但還不是i386 平臺的,只是說"cc"是處理器平臺相關的,並非所有的平臺都支持它,但即使在不支持它的 平臺上,使用它也不會造成編譯錯誤。我做了一些實驗,但發現使用"cc"和不使用"cc"所生 成的代碼沒有任何不同。但Linux2.4的相關代碼中用到了它。如果誰知道在i386平臺上"cc" 的細節,請和我聯繫。


另外,還可以在Clobber/Modify域指定數字0到9,以聲明第n個Input/Output操 作表達式所使用的寄存器發生了變化,但正如我們在前面所提到的,如果你爲某個 Input/Output  操作表達式指定了寄存器,或使用"g","r"等約束讓 GCC  爲其選擇寄存器, GCC  已經知道哪個寄存器內容發生了變化,所以這麼做沒有什麼意義;我也作了相關的試 驗,沒有發現使用它會對GCC  生成的彙編代碼有任何影響,至少在i386  平臺上是這樣。 Linux 2.4的所有i386平臺相關內聯彙編代碼中都沒有使用這一點,但S390平臺相關代碼 中有用到,但由於我對S390彙編沒有任何概念,所以,也不知道這麼做的意義何在。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章