GCC內嵌彙編

GCC內嵌彙編

刺蝟@http://blog.csdn.net/littlehedgehog

AT&T手冊裏面的，我整理了下，方便閱讀

內核代碼絕大部分使用C 語言編寫，只有一小部分使用彙編語言編寫，例如與特定體系結構相關的代碼和對性能影響很大的代碼。GCC提供了內嵌彙編的功能，可以在C代碼中直接內嵌彙編語言語句，大大方便了程序設計。

簡單的內嵌彙編很容易理解
例如:

__asm____volatile__("hlt");

“__asm__”表示後面的代碼爲內嵌彙編，“asm”是“__asm__”的別名。
“__volatile__”表示編譯器不要優化代碼，後面的指令保留原樣，
“volatile”是它的別名。括號裏面是彙編指令。

使用內嵌彙編，要先編寫彙編指令模板，然後將C語言表達式與指令的操作數相關聯，並告訴GCC對這些操作有哪些限制條件。例如在下面的彙編語句：[下段解釋一定要耐着性子看懂讀懂！]

__asm__ __violate__ ("movl %1,%0" : "=r" (result) : "m" (input));

“movl %1,%0”是指令模板；“%0”和“%1”代表指令的操作數，稱爲佔位符，內嵌彙編靠它們將C語言表達式與指令操作數相對應。指令模板後面用小括號括起來的是C語言表達式，本例中只有兩個：“result”和“input”，他們按照出現的順序分別與指令操作數“%0”，“%1，”對應；注意對應順序：第一個C表達式對應“%0”；第二個表達式對應“%1”，依次類推，操作數至多有10個，分別用“%0”，“%1”….“%9，”表示。在每個操作數前面有一個用引號括起來的字符串，字符串的內容是對該操作數的限制或者說要求。“result”前面的限制字符串是“=r”，其中“=”表示“result”是輸出操作數，“r”表示需要將“result”與某個通用寄存器相關聯，先將操作數的值讀入寄存器，然後在指令中使用相應寄存器，而不是“result”本身，當然指令執行完後需要將寄存器中的值存入變量“result”，從表面上看好像是指令直接對“result”進行操作，實際上GCC做了隱式處理，這樣我們可以少寫一些指令。“input”前面的“r”表示該表達式需要先放入某個寄存器，然後在指令中使用該寄存器參加運算。

下面來看看一個內嵌彙編的小例子:

  extern     int    input,result;

  void test(void)
  {
         input= 1;
  __asm__ __volatile__ ("movl %1,%0" :
  "=r" (result) : "r" (input));
         return ;
  }

對應的彙編代碼如下;

行號代碼解釋

1
7
8 movl    $1, input                           對應C語言語句input = 1;
9 movl     input, %eax
10 #APP                                              GCC插入的註釋，表示內嵌彙編開始
11 movl     %eax,%eax                     我們的內嵌彙編語句
12 #NO_APP                                      GCC 插入的註釋，表示內嵌彙編結束
13 movl      %eax, result                  將結果存入result變量

從彙編代碼可以看出，第9行和第13行是GCC，自動增加的代碼，GCC 根據限定字符串決定如何處理C表達式，本例兩個表達式都被指定爲“r”型，所以先使用指令
movl input, %eax 將input讀入寄存器%eax；

GCC，也指定一個寄存器與輸出變量result 相關，本例也是%eax，等得到操作結果後再使用指令：

movl %eax, result

將寄存器的值寫回C變量result中。從上面的彙編代碼我們可以看出與result 和input，相關連的寄存器都是%eax，GCC使用%eax，替換內嵌彙編指令模板中的 %0，%1

movl %eax,%eax
顯然這一句可以不要。但是沒有優化，所以這一句沒有被去掉。

由此可見，C表達式或者變量與寄存器的關係由GCC自動處理，我們只需使用限制字符串指導GCC 如何處理即可。限制字符必須與指令對操作數的要求相匹配，否則產生的彙編代碼將會有錯，讀者可以將上例中的兩個“r”，都改爲“m”(m，表示操作數放在內存，而不是寄存器中)，編譯後得到的結果是：

movl input, result

很明顯這是一條非法指令，因此限制字符串必須與指令對操作數的要求匹配。例如指令movl允許寄存器到寄存器，立即數到寄存器等，但是不允許內存到內存的操作，因此兩個操作數不能同時使用“m”作爲限定字符。

由此我們可以總結出來內嵌彙編的格式:

__asm__(
彙編語句模板:
輸出部分:
輸入部分:
破壞描述部分)

共四個部分：彙編語句模板，輸出部分，輸入部分，破壞描述部分，各部分使用“:”格開，彙編語句模板必不可少，其他三部分可選，如果使用了後面的部分，而前面部分爲空，也需要用“:”格開，相應部分內容爲空。例如：

__asm__ __volatile__(
"cli":
:
:"memory")

我們來分別說明:

輸出部分

輸出部分描述輸出操作數，不同的操作數描述符之間用逗號格開，每個操作數描述符由限定字符串和C語言變量組成。每個輸出操作數的限定字符串必須包含“=”表示他是一個輸出操作數。

例：

__asm__ __volatile__("pushfl ; popl %0 ; cli":"=g" (x) )

描述符字符串表示對該變量的限制條件，這樣GCC就可以根據這些條件決定如何分配寄存器，如何產生必要的代碼處理指令操作數與C表達式或C變量之間的聯繫.

輸入部分

輸入部分描述輸入操作數，不同的操作數描述符之間使用逗號格開，每個操作數描述符由限定字符串和C語言表達式或者C語言變量組成。

例如:

Static __inline__ void __set_bit(int nr, volatile void * addr)
  {
         __asm__(
         "btsl %1,%0"   :
         "=m"(addr)    :
         "Ir"(nr)
              );
  }

該例子功能是將(*addr)的第nr位設爲1。第一個佔位符%0與C，語言變量ADDR對應，第二個佔位符%1與C，語言變量nr對應。因此上面的彙編語句代碼與下面的僞代碼等價：
btsl nr, ADDR，該指令的兩個操作數不能全是內存變量，因此將nr的限定字符串指定"lr"(下文會有解釋)，與立即數或者寄存器相關聯，這樣兩個操作數中只有ADDR爲內存變量。

限制字符
限制字符有很多種，有些是與特定體系結構相關，此處僅列出常用的限定字符和i386中可能用到的一些常用的限定符。它們的作用是指示編譯器如何處理其後的C語言變量與指令操作數之間的關係，例如是將變量放在寄存器中還是放在內存中等，下表列出了常用的限定字母。

“b”將輸入變量放入ebx
“c”將輸入變量放入ecx
“d”將輸入變量放入edx
“s”將輸入變量放入esi
“d”將輸入變量放入edi
“q”將輸入變量放入eax，ebx ,ecx ，edx中的一個
“r”將輸入變量放入通用寄存器，也就是eax ，ebx，ecx,edx，esi，edi中的一個
“A”把eax和edx，合成一個64位的寄存器(uselong longs)
“m”內存變量
“o”操作數爲內存變量，但是其尋址方式是偏移量類型，也即是基址尋址，或者是基址加變址尋址
“V”操作數爲內存變量，但尋址方式不是偏移量類型
“,” 操作數爲內存變量，但尋址方式爲自動增量
“p”操作數是一個合法的內存地址（指針）


寄存器或內存

“g” 將輸入變量放入eax，ebx，ecx ，edx中的一個或者作爲內存變量
“X”操作數可以是任何類型


立即數
“I” 0-31 之間的立即數（用於32位移位指令）
“J” 0-63 之間的立即數（用於64 位移位指令）
“N” 0-255 ，之間的立即數（用於out 指令）
“i” 立即數
“n” 立即數，有些系統不支持除字以外的立即數，這些系統應該使用“n”而不是“i”


匹配

  "0"、"1" ....."9"
表示用它限制的操作數與某個指定的操作數匹配，也即該操作數就是指定的那個操作數，例如用“0 ”去描述“％1”操作數，那麼“%1”引用的其實就是“%0”操作數，注意作爲限定符字母的0－9 ，與指令中的“％0”－“％9”的區別，前者描述操作數，後者代表操作數。

操作數類型
“=” 操作數在指令中是隻寫的（輸出操作數）
“+” 操作數在指令中是讀寫類型的（輸入輸出操作數）

   浮點數
“f”

浮點寄存器
“t”第一個浮點寄存器
“u”第二個浮點寄存器
“G”標準的80387

現在繼續看上面的例子：
"=m" (ADDR)表示ADDR爲內存變量（“m”），而且是輸出變量（“=”）；"Ir" (nr)表示nr，爲 0－31之間的立即數（“I”）或者一個寄存器操作數（“r”）。

匹配限制符是一位數字 "0"、"1" ....."9" , 分別表示它限制的C表達式分別與佔位符%0，%1，……%9對應的C變量匹配。例如使用“0”作爲%1，的限制字符，那麼 %0和%1表示同一個C變量。
還是來看個例子吧:

  extern int input,result;
  void test_at_t()
  {
         result  = 0;
         input  = 1;
         __asm__
     __volatile__ ("addl  %2,%0":"=r"(result):"0"(result),"m"(input));

  }

輸入部分中的result用匹配限制符“0”限制，表示%1與％0，代表同一個變量，輸入部分說明該變量的輸入功能，輸出部分說明該變量的輸出功能，兩者結合表示result, 是讀寫型。因爲%0和%1，表示同一個C變量，所以放在相同的位置，無論是寄存器還是內存。

寄存器破壞描述符

通常編寫程序只使用一種語言：高級語言或者彙編語言。高級語言編譯的步驟大致如下：

預處理；
l
編譯
l
彙編
l
鏈接

我們這裏只關心第二步編譯（將C代碼轉換成彙編代碼）：因爲所有的代碼都是用高級語言編寫，編譯器可以識別各種語句的作用，在轉換的過程中所有的寄存器都由編譯器決定如何分配使用，它有能力保證寄存器的使用不會衝突；也可以利用寄存器作爲變量的緩衝區，因爲寄存器的訪問速度比內存快很多倍。如果全部使用彙編語言則由程序員去控制寄存器的使用，只能靠程序員去保證寄存器使用的正確性。但是如果兩種語言混用情況就變複雜了，因爲內嵌的彙編代碼可以直接使用寄存器，而編譯器在轉換的時候並不去檢查內嵌的彙編代碼使用了哪些寄存器（因爲很難檢測彙編指令使用了哪些寄存器，例如有些指令隱式修改寄存器，有時內嵌的彙編代碼會調用其他子過程，而子過程也會修改寄存器），因此需要一種機制通知編譯器我們使用了哪些寄存器（程序員自己知道內嵌彙編代碼中使用了哪些寄存器），否則對這些寄存器的使用就有可能導致錯誤，修改描述部分可以起到這種作用。當然內嵌彙編的輸入輸出部分指明的寄存器或者指定爲“r”，“g”型由編譯器去分配的寄存器就不需要在破壞描述部分去描述，因爲編譯器已經知道了。

下面看個例子就很清楚爲什麼需要通知GCC內嵌彙編代碼中隱式（稱它爲隱式是因爲GCC並不知道）使用的寄存器。

在內嵌的彙編指令中可能會直接引用某些寄存器，我們已經知道AT&T格式的彙編語言中，寄存器名以“%”作爲前綴，爲了在生成的彙編程序中保留這個“%”號，在asm語句中對寄存器的引用必須用“%%”作爲寄存器名稱的前綴。原因是“%”在asm，內嵌彙編語句中的作用與“/”在C語言中的作用相同，因此“%%”轉換後代表“%”。

int main(void)
{
     int input, output,temp;
    input = 1;
    __asm__ __volatile__  ("movl $0, %%eax;
            movl %%eax, %1;
            movl %2, %%eax;
            movl %%eax, %0; "
            :"=m"(output),"=m"(temp)    /* output */
            :"r"(input)     /* input */
            );
    return 0;
}

這段代碼使用%eax作爲臨時寄存器，功能相當於C代碼：“temp = 0;output=input”，
對應的彙編代碼如下：

         movl $1,-4(%ebp)
         movl -4(%ebp),%eax /APP
         movl $0, %eax;
        movl %eax, -12(%ebp);
         movl %eax, %eax;
         movl %eax, -8(%ebp);       /NO_APP

顯然GCC給input分配的寄存器也是%eax，發生了衝突，output的值始終爲0，而不是input。

使用破壞描述後的代碼：

int main(void)
{
    int input, output,temp;
         input  = 1;
   __asm__ __volatile__
  (    "movl $0, %%eax;
                         movl  %%eax, %1;
                         movl  %2, %%eax;
                         movl  %%eax, %0; "
                         :"=m"(output),"=m"(temp)    /* output */
                         :"r"(input)     /* input */
                         :"eax");  /* 描述符 */

   return 0;
}

對應的彙編代碼：

         movl $1,-4(%ebp)
         movl -4(%ebp),%edx            //APP
         movl $0, %eax;
         movl %eax, -12(%ebp);
         movl %edx, %eax;
         movl %eax, -8(%ebp);         /NO_APP


通過破壞描述部分，GCC得知%eax已被使用，因此給input分配了%edx。在使用內嵌彙編時請記住一點：儘量告訴GCC儘可能多的信息，以防出錯。

京東面試：如何進行JVM調優？

美團一面：項目中有 10000 個 if else 如何優化？想了半天，被問懵了！

Python 將PowerPoint (PPT/PPTX) 轉爲HTML

SQL優化-20231016

10個工具讓你的 shell 腳本更強大

GCC內嵌彙編

我的Linux書架

linux 修改主機名

Linux TCP/IP 協議棧的關鍵數據結構Socket Buffer(sk_buff )

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結