gcc內嵌彙編

原文鏈接：https://blog.csdn.net/qq_26093511/article/details/79546321

開發Arm程序的時候,大多數時候使用C/C++語言就可以了,但彙編語言在某些情況下能夠實現一些C語言無法實現的功能,這時候就要調用一些彙編語言的程序.我們需要大概瞭解一下在C語言中如何嵌入彙編語言.

內嵌彙編語法如下：

   __asm__(彙編語句模板: 輸出部分: 輸入部分: 破壞描述部分)

共四個部分：彙編語句模板，輸出部分，輸入部分，破壞描述部分，各部分使用“:”格開，彙編語句模板必不可少，其他三部分可選，如果使用了後面的部分，而前面部分爲空，也需要用“:”格開，相應部分內容爲空。例如：
asm volatile(“cli”: : :“memory”)

1、彙編語句模板
彙編語句模板由彙編語句序列組成，語句之間使用“;”、“\n”或“\n\t”分開。指令中的操作數可以使用佔位符引用C語言變量，操作數佔位符最多10個，名稱如下：%0，%1，…，%9。指令中使用佔位符表示的操作數，總被視爲long型（4個字節），但對其施加的操作根據指令可以是字或者字節，當把操作數當作字或者字節使用時，默認爲低字或者低字節。對字節操作可以顯式的指明是低字節還是次字節。方法是在%和序號之間插入一個字母，“b”代表低字節，“h”代表高字節，例如：%h1。

2、輸出部分
輸出部分描述輸出操作數，不同的操作數描述符之間用逗號格開，每個操作數描述符由限定字符串和C 語言變量組成。每個輸出操作數的限定字符串必須包含“=”表示他是一個輸出操作數。
例：
asm volatile(“pushfl ; popl %0 ; cli”:"=g" (x) )
描述符字符串表示對該變量的限制條件，這樣GCC 就可以根據這些條件決定如何分配寄存器，如何產生必要的代碼處理指令操作數與C表達式或C變量之間的聯繫。

3、輸入部分
輸入部分描述輸入操作數，不同的操作數描述符之間使用逗號格開，每個操作數描述符由限定字符串和C語言表達式或者C語言變量組成。
例1 ：
asm volatile (“lidt %0” : : “m” (real_mode_idt));
例二（bitops.h）：

Static inline void __set_bit(int nr, volatile void * addr)
{
asm(
“btsl %1,%0”
:"=m" (ADDR)
:“Ir” (nr));
}

後例功能是將(*addr)的第nr位設爲1。第一個佔位符%0與C 語言變量ADDR對應，第二個佔位符%1與C語言變量nr對應。因此上面的彙編語句代碼與下面的僞代碼等價：btsl nr, ADDR，該指令的兩個操作數不能全是內存變量，因此將nr的限定字符串指定爲“Ir”，將nr 與立即數或者寄存器相關聯，這樣兩個操作數中只有ADDR爲內存變量。

4、限制字符
4.1、限制字符列表
限制字符有很多種，有些是與特定體系結構相關，此處僅列出常用的限定字符和i386中可能用到的一些常用的限定符。它們的作用是指示編譯器如何處理其後的C語言變量與指令操作數之間的關係。

分類限定符描述
通用寄存器 “a” 將輸入變量放入eax
這裏有一個問題：假設eax已經被使用，那怎麼辦？
其實很簡單：因爲GCC 知道eax 已經被使用，它在這段彙編代碼
的起始處插入一條語句pushl %eax，將eax 內容保存到堆棧，然
後在這段代碼結束處再增加一條語句popl %eax，恢復eax的內容
“b” 將輸入變量放入ebx
“c” 將輸入變量放入ecx
“d” 將輸入變量放入edx
“s” 將輸入變量放入esi
“d” 將輸入變量放入edi
“q” 將輸入變量放入eax，ebx，ecx，edx中的一個
“r” 將輸入變量放入通用寄存器，也就是eax，ebx，ecx，edx，esi，edi中的一個
“A” 把eax和edx合成一個64 位的寄存器(use long longs)

   內存          “m”             內存變量 
                 “o”             操作數爲內存變量，但是其尋址方式是偏移量類型， 
                                   也即是基址尋址，或者是基址加變址尋址 
                 “V”             操作數爲內存變量，但尋址方式不是偏移量類型 
                 “ ”             操作數爲內存變量，但尋址方式爲自動增量 
                 “p”             操作數是一個合法的內存地址（指針） 

 寄存器或內存     “g”             將輸入變量放入eax，ebx，ecx，edx中的一個 
                                   或者作爲內存變量 
                   “X”             操作數可以是任何類型 

 立即數 
                 “I”             0-31之間的立即數（用於32位移位指令） 
                   “J”             0-63之間的立即數（用於64位移位指令） 
                 “N”             0-255之間的立即數（用於out指令） 
                 “i”             立即數   
                 “n”             立即數，有些系統不支持除字以外的立即數， 
                                   這些系統應該使用“n”而不是“i” 

 匹配             “ 0 ”，         表示用它限制的操作數與某個指定的操作數匹配， 
                 “1” ...               也即該操作數就是指定的那個操作數，例如“0” 
                   “9”             去描述“％1”操作數，那麼“%1”引用的其實就 
                                   是“%0”操作數，注意作爲限定符字母的0－9 與 
                                   指令中的“％0”－“％9”的區別，前者描述操作數， 
                                   後者代表操作數。 
                   &               該輸出操作數不能使用過和輸入操作數相同的寄存器 

 操作數類型         “=”           操作數在指令中是隻寫的（輸出操作數）   
                   “+”           操作數在指令中是讀寫類型的（輸入輸出操作數） 

 浮點數             “f”           浮點寄存器 
                   “t”           第一個浮點寄存器 
                   “u”           第二個浮點寄存器 
                   “G”           標準的80387浮點常數 
                     %             該操作數可以和下一個操作數交換位置 
                                   例如addl的兩個操作數可以交換順序 
                                   （當然兩個操作數都不能是立即數） 
                   #                   部分註釋，從該字符到其後的逗號之間所有字母被忽略 
                   *                     表示如果選用寄存器，則其後的字母被忽略

5、破壞描述部分
破壞描述符用於通知編譯器我們使用了哪些寄存器或內存，由逗號格開的字符串組成，每個字符串描述一種情況，一般是寄存器名；除寄存器外還有“memory”。例如：“%eax”，“%ebx”，“memory”等。

轉自：http://blog.chinaunix.net/uid-26941022-id-3202417.html

GCC內嵌彙編

刺蝟@http://blog.csdn.net/littlehedgehog

AT&T手冊裏面的，我整理了下，方便閱讀

內核代碼絕大部分使用C 語言編寫，只有一小部分使用彙編語言編寫，例如與特定體系結構相關的代碼和對性能影響很大的代碼。GCC提供了內嵌彙編的功能，可以在C代碼中直接內嵌彙編語言語句，大大方便了程序設計。

簡單的內嵌彙編很容易理解
例如:

asm____volatile(“hlt”);

“asm”表示後面的代碼爲內嵌彙編，“asm”是“asm”的別名。
“volatile”表示編譯器不要優化代碼，後面的指令保留原樣，
“volatile”是它的別名。括號裏面是彙編指令。

使用內嵌彙編，要先編寫彙編指令模板，然後將C語言表達式與指令的操作數相關聯，並告訴GCC對這些操作有哪些限制條件。例如在下面的彙編語句：[下段解釋一定要耐着性子看懂讀懂！]

asm violate (“movl %1,%0” : “=r” (result) : “m” (input));
“movl %1,%0”是指令模板；“%0”和“%1”代表指令的操作數，稱爲佔位符，內嵌彙編靠它們將C語言表達式與指令操作數相對應。指令模板後面用小括號括起來的是C語言表達式，本例中只有兩個：“result”和“input”，他們按照出現的順序分別與指令操作數“%0”，“%1，”對應；注意對應順序：第一個C表達式對應“%0”；第二個表達式對應“%1”，依次類推，操作數至多有10個，分別用“%0”，“%1”….“%9，”表示。在每個操作數前面有一個用引號括起來的字符串，字符串的內容是對該操作數的限制或者說要求。“result”前面的限制字符串是“=r”，其中“=”表示“result”是輸出操作數，“r”表示需要將“result”與某個通用寄存器相關聯，先將操作數的值讀入寄存器，然後在指令中使用相應寄存器，而不是“result”本身，當然指令執行完後需要將寄存器中的值存入變量“result”，從表面上看好像是指令直接對“result”進行操作，實際上GCC做了隱式處理，這樣我們可以少寫一些指令。“input”前面的“r”表示該表達式需要先放入某個寄存器，然後在指令中使用該寄存器參加運算。

下面來看看一個內嵌彙編的小例子:

extern int input,result;

void test(void)
{
input= 1;
asm volatile (“movl %1,%0” :
“=r” (result) : “r” (input));
return ;
}

對應的彙編代碼如下;

行號代碼解釋

1
7
8 movl $1, input 對應C語言語句input = 1;
9 movl input, %eax
10 #APP GCC插入的註釋，表示內嵌彙編開始
11 movl %eax,%eax 我們的內嵌彙編語句
12 #NO_APP GCC 插入的註釋，表示內嵌彙編結束
13 movl %eax, result 將結果存入result變量

從彙編代碼可以看出，第9行和第13行是GCC，自動增加的代碼，GCC 根據限定字符串決定如何處理C表達式，本例兩個表達式都被指定爲“r”型，所以先使用指令
movl input, %eax 將input讀入寄存器%eax；

GCC，也指定一個寄存器與輸出變量result 相關，本例也是%eax，等得到操作結果後再使用指令：

movl %eax, result

將寄存器的值寫回C變量result中。從上面的彙編代碼我們可以看出與result 和input，相關連的寄存器都是%eax，GCC使用%eax，替換內嵌彙編指令模板中的 %0，%1

movl %eax,%eax
顯然這一句可以不要。但是沒有優化，所以這一句沒有被去掉。

由此可見，C表達式或者變量與寄存器的關係由GCC自動處理，我們只需使用限制字符串指導GCC 如何處理即可。限制字符必須與指令對操作數的要求相匹配，否則產生的彙編代碼將會有錯，讀者可以將上例中的兩個“r”，都改爲“m”(m，表示操作數放在內存，而不是寄存器中)，編譯後得到的結果是：

movl input, result

很明顯這是一條非法指令，因此限制字符串必須與指令對操作數的要求匹配。例如指令movl允許寄存器到寄存器，立即數到寄存器等，但是不允許內存到內存的操作，因此兩個操作數不能同時使用“m”作爲限定字符。

由此我們可以總結出來內嵌彙編的格式:

asm(
彙編語句模板:
輸出部分:
輸入部分:
破壞描述部分)

共四個部分：彙編語句模板，輸出部分，輸入部分，破壞描述部分，各部分使用“:”格開，彙編語句模板必不可少，其他三部分可選，如果使用了後面的部分，而前面部分爲空，也需要用“:”格開，相應部分內容爲空。例如：

asm volatile(
“cli”:
:
:“memory”)

我們來分別說明:

輸出部分

輸出部分描述輸出操作數，不同的操作數描述符之間用逗號格開，每個操作數描述符由限定字符串和C語言變量組成。每個輸出操作數的限定字符串必須包含“=”表示他是一個輸出操作數。

例：

asm volatile(“pushfl ; popl %0 ; cli”:"=g" (x) )

描述符字符串表示對該變量的限制條件，這樣GCC就可以根據這些條件決定如何分配寄存器，如何產生必要的代碼處理指令操作數與C表達式或C變量之間的聯繫.

輸入部分

輸入部分描述輸入操作數，不同的操作數描述符之間使用逗號格開，每個操作數描述符由限定字符串和C語言表達式或者C語言變量組成。

例如:

Static inline void __set_bit(int nr, volatile void * addr)
{
asm(
“btsl %1,%0” :
“=m”(addr) :
“Ir”(nr)
);
}

該例子功能是將(*addr)的第nr位設爲1。第一個佔位符%0與C，語言變量ADDR對應，第二個佔位符%1與C，語言變量nr對應。因此上面的彙編語句代碼與下面的僞代碼等價：
btsl nr, ADDR，該指令的兩個操作數不能全是內存變量，因此將nr的限定字符串指定"lr"(下文會有解釋)，與立即數或者寄存器相關聯，這樣兩個操作數中只有ADDR爲內存變量。

限制字符
限制字符有很多種，有些是與特定體系結構相關，此處僅列出常用的限定字符和i386中可能用到的一些常用的限定符。它們的作用是指示編譯器如何處理其後的C語言變量與指令操作數之間的關係，例如是將變量放在寄存器中還是放在內存中等，下表列出了常用的限定字母。

“b”將輸入變量放入ebx
“c”將輸入變量放入ecx
“d”將輸入變量放入edx
“s”將輸入變量放入esi
“d”將輸入變量放入edi
“q”將輸入變量放入eax，ebx ,ecx ，edx中的一個
“r”將輸入變量放入通用寄存器，也就是eax ，ebx，ecx,edx，esi，edi中的一個
“A”把eax和edx，合成一個64位的寄存器(uselong longs)
“m”內存變量
“o”操作數爲內存變量，但是其尋址方式是偏移量類型，也即是基址尋址，或者是基址加變址尋址
“V”操作數爲內存變量，但尋址方式不是偏移量類型
“,” 操作數爲內存變量，但尋址方式爲自動增量
“p”操作數是一個合法的內存地址（指針）

寄存器或內存

“g” 將輸入變量放入eax，ebx，ecx ，edx中的一個或者作爲內存變量
“X”操作數可以是任何類型

立即數
“I” 0-31 之間的立即數（用於32位移位指令）
“J” 0-63 之間的立即數（用於64 位移位指令）
“N” 0-255 ，之間的立即數（用於out 指令）
“i” 立即數
“n” 立即數，有些系統不支持除字以外的立即數，這些系統應該使用“n”而不是“i”

匹配

“0”、“1” …“9”
表示用它限制的操作數與某個指定的操作數匹配，也即該操作數就是指定的那個操作數，例如用“0 ”去描述“％1”操作數，那麼“%1”引用的其實就是“%0”操作數，注意作爲限定符字母的0－9 ，與指令中的“％0”－“％9”的區別，前者描述操作數，後者代表操作數。

操作數類型
“=” 操作數在指令中是隻寫的（輸出操作數）
“+” 操作數在指令中是讀寫類型的（輸入輸出操作數）

浮點數
“f”

浮點寄存器
“t”第一個浮點寄存器
“u”第二個浮點寄存器
“G”標準的80387

現在繼續看上面的例子：
“=m” (ADDR)表示ADDR爲內存變量（“m”），而且是輸出變量（“=”）；“Ir” (nr)表示nr，爲 0－31之間的立即數（“I”）或者一個寄存器操作數（“r”）。

匹配限制符是一位數字 “0”、“1” …“9” , 分別表示它限制的C表達式分別與佔位符%0，%1，……%9對應的C變量匹配。例如使用“0”作爲%1，的限制字符，那麼 %0和%1表示同一個C變量。
還是來看個例子吧:

extern int input,result;
void test_at_t()
{
result = 0;
input = 1;
asm
volatile (“addl %2,%0”:"=r"(result):“0”(result),“m”(input));

}

輸入部分中的result用匹配限制符“0”限制，表示%1與％0，代表同一個變量，輸入部分說明該變量的輸入功能，輸出部分說明該變量的輸出功能，兩者結合表示result, 是讀寫型。因爲%0和%1，表示同一個C變量，所以放在相同的位置，無論是寄存器還是內存。

寄存器破壞描述符

通常編寫程序只使用一種語言：高級語言或者彙編語言。高級語言編譯的步驟大致如下：

預處理；
l
編譯
l
彙編
l
鏈接

我們這裏只關心第二步編譯（將C代碼轉換成彙編代碼）：因爲所有的代碼都是用高級語言編寫，編譯器可以識別各種語句的作用，在轉換的過程中所有的寄存器都由編譯器決定如何分配使用，它有能力保證寄存器的使用不會衝突；也可以利用寄存器作爲變量的緩衝區，因爲寄存器的訪問速度比內存快很多倍。如果全部使用彙編語言則由程序員去控制寄存器的使用，只能靠程序員去保證寄存器使用的正確性。但是如果兩種語言混用情況就變複雜了，因爲內嵌的彙編代碼可以直接使用寄存器，而編譯器在轉換的時候並不去檢查內嵌的彙編代碼使用了哪些寄存器（因爲很難檢測彙編指令使用了哪些寄存器，例如有些指令隱式修改寄存器，有時內嵌的彙編代碼會調用其他子過程，而子過程也會修改寄存器），因此需要一種機制通知編譯器我們使用了哪些寄存器（程序員自己知道內嵌彙編代碼中使用了哪些寄存器），否則對這些寄存器的使用就有可能導致錯誤，修改描述部分可以起到這種作用。當然內嵌彙編的輸入輸出部分指明的寄存器或者指定爲“r”，“g”型由編譯器去分配的寄存器就不需要在破壞描述部分去描述，因爲編譯器已經知道了。

下面看個例子就很清楚爲什麼需要通知GCC內嵌彙編代碼中隱式（稱它爲隱式是因爲GCC並不知道）使用的寄存器。

在內嵌的彙編指令中可能會直接引用某些寄存器，我們已經知道AT&T格式的彙編語言中，寄存器名以“%”作爲前綴，爲了在生成的彙編程序中保留這個“%”號，在asm語句中對寄存器的引用必須用“%%”作爲寄存器名稱的前綴。原因是“%”在asm，內嵌彙編語句中的作用與“/”在C語言中的作用相同，因此“%%”轉換後代表“%”。

int main(void)
{
int input, output,temp;
input = 1;
asm volatile (“movl $0, %%eax;
movl %%eax, %1;
movl %2, %%eax;
movl %%eax, %0; "
:”=m"(output),"=m"(temp) /* output /
:“r”(input) / input */
);
return 0;
}

這段代碼使用%eax作爲臨時寄存器，功能相當於C代碼：“temp = 0;output=input”，
對應的彙編代碼如下：

     movl  $1,-4(%ebp)
     movl -4(%ebp),%eax  /APP
     movl  $0, %eax;
    movl %eax, -12(%ebp);
     movl %eax, %eax;
     movl %eax, -8(%ebp);       /NO_APP

顯然GCC給input分配的寄存器也是%eax，發生了衝突，output的值始終爲0，而不是input。

使用破壞描述後的代碼：

int main(void)
{
int input, output,temp;
input = 1;
asm volatile
( “movl $0, %%eax;
movl %%eax, %1;
movl %2, %%eax;
movl %%eax, %0; "
:”=m"(output),"=m"(temp) /* output /
:“r”(input) / input /
:“eax”); / 描述符 */

return 0;
}

對應的彙編代碼：

     movl $1,-4(%ebp)
     movl  -4(%ebp),%edx            //APP
     movl  $0, %eax;
     movl  %eax, -12(%ebp);
     movl  %edx, %eax;
     movl  %eax, -8(%ebp);         /NO_APP

通過破壞描述部分，GCC得知%eax已被使用，因此給input分配了%edx。在使用內嵌彙編時請記住一點：儘量告訴GCC儘可能多的信息，以防出錯。

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

linux安裝cuda和cudnn

Mellanox網卡開啓SR-IOV

模擬手機設備：使用 Playwright 實現移動端自動化測試

HTML 00 Tutorial

全面系統的AI學習路徑，幫助普通人也能玩轉AI

從零開始：使用 Playwright 腳本錄製實現自動化測試

uni-app實現上拉加載

ARM Cortex A7 架構簡介

雜談-常用算法

鏈表的小應用-約瑟夫問題

常見通訊協議介紹

linux 系統啓動第二課

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結