AT&T彙編是UNIX下慣用的彙編格式 l ,w,b是AT&T彙編中用來表示操作屬性的限定符 l是長字(4字節), w是雙字 b是一個字節 加在指令的後邊 相當於intel中的 dword ptr word ptr byte ptr
movl 12(%ebp), %eax,等同於Intel格式中的mov EAX, [EBP + 12],AT&T中,源操作數在左,目的操作數在右。“l”是Longword,相當於Intel格式中的dword ptr操作限定符; 表示將地址SS:[EBP +12]指向的雙字數據傳送至EAX寄存器。 addl 8(%ebp), %eax,等同於Intel格式中的add EAX, [EBP + 8],表示將SS:[EBP + 8]指向的一個雙字數據同寄存器EAX中的原值相加,所得的結果保存在EAX寄存器。摘自:http://blog.sina.com.cn/s/blog_51e9c0ab010099ow.html
一、AT&T 格式Linux 彙編語法格式
二、Hello World!
既然所有程序設計語言的第一個例子都是在屏幕上打印一個字符串 "Hello World!",那我們也以這種方式來開始介紹 Linux 下的彙編語言程序設計。
在 Linux 操作系統中,你有很多辦法可以實現在屏幕上顯示一個字符串,但最簡潔的方式是使用 Linux 內核提供的系統調用。使用這種方法最大的好處是可以直接和操作系統的內核進行通訊,不需要鏈接諸如 libc 這樣的函數庫,也不需要使用 ELF 解釋器,因而代碼尺寸小且執行速度快。
Linux 是一個運行在保護模式下的 32 位操作系統,採用 flat memory 模式,目前最常用到的是 ELF 格式的二進制代碼。一個 ELF 格式的可執行程序通常劃分爲如下幾個部分:.text、.data 和 .bss,其中 .text 是隻讀的代碼區,.data 是可讀可寫的數據區,而 .bss 則是可讀可寫且沒有初始化的數據區。代碼區和數據區在 ELF 中統稱爲 section,根據實際需要你可以使用其它標準的 section,也可以添加自定義 section,但一個
ELF 可執行程序至少應該有一個 .text 部分。下面給出我們的第一個彙編程序,用的是 AT&T 彙編語言格式:
例1. AT&T 格式
初次接觸到 AT&T 格式的彙編代碼時,很多程序員都認爲太晦澀難懂了,沒有關係,在 Linux 平臺上你同樣可以使用 Intel 格式來編寫彙編程序:
例2. Intel 格式
上面兩個彙編程序採用的語法雖然完全不同,但功能卻都是調用 Linux 內核提供的 sys_write 來顯示一個字符串,然後再調用 sys_exit 退出程序。在 Linux 內核源文件 include/asm-i386/unistd.h 中,可以找到所有系統調用的定義。
即便是最簡單的彙編程序,也難免要用到諸如輸入、輸出以及退出等操作,而要進行這些操作則需要調用操作系統所提供的服務,也就是系統調用。除非你的程序只完成加減乘除等數學運算,否則將很難避免使用系統調用,事實上除了系統調用不同之外,各種操作系統的彙編編程往往都是很類似的。
在 Linux 平臺下有兩種方式來使用系統調用:利用封裝後的 C 庫(libc)或者通過彙編直接調用。其中通過彙編語言來直接調用系統調用,是最高效地使用 Linux 內核服務的方法,因爲最終生成的程序不需要與任何庫進行鏈接,而是直接和內核通信。
和 DOS 一樣,Linux 下的系統調用也是通過中斷(int 0x80)來實現的。在執行 int 80 指令時,寄存器 eax 中存放的是系統調用的功能號,而傳給系統調用的參數則必須按順序放到寄存器 ebx,ecx,edx,esi,edi 中,當系統調用完成之後,返回值可以在寄存器 eax 中獲得。
所有的系統調用功能號都可以在文件 /usr/include/bits/syscall.h 中找到,爲了便於使用,它們是用 SYS_<name> 這樣的宏來定義的,如 SYS_write、SYS_exit 等。例如,經常用到的 write 函數是如下定義的:
該函數的功能最終是通過 SYS_write 這一系統調用來實現的。根據上面的約定,參數 fb、buf 和 count 分別存在寄存器 ebx、ecx 和 edx 中,而系統調用號 SYS_write 則放在寄存器 eax 中,當 int 0x80 指令執行完畢後,返回值可以從寄存器 eax 中獲得。
或許你已經發現,在進行系統調用時至多隻有 5 個寄存器能夠用來保存參數,難道所有系統調用的參數個數都不超過 5 嗎?當然不是,例如 mmap 函數就有 6 個參數,這些參數最後都需要傳遞給系統調用 SYS_mmap:
當一個系統調用所需的參數個數大於 5 時,執行int 0x80 指令時仍需將系統調用功能號保存在寄存器 eax 中,所不同的只是全部參數應該依次放在一塊連續的內存區域裏,同時在寄存器 ebx 中保存指向該內存區域的指針。系統調用完成之後,返回值仍將保存在寄存器 eax 中。
由於只是需要一塊連續的內存區域來保存系統調用的參數,因此完全可以像普通的函數調用一樣使用棧(stack)來傳遞系統調用所需的參數。但要注意一點, Linux 採用的是 C 語言的調用模式,這就意味着所有參數必須以相反的順序進棧,即最後一個參數先入棧,而第一個參數則最後入棧。如果採用棧來傳遞系統調用所需的參數,在執行 int 0x80 指令時還應該將棧指針的當前值複製到寄存器 ebx中。
在 Linux 操作系統中,當一個可執行程序通過命令行啓動時,其所需的參數將被保存到棧中:首先是 argc,然後是指向各個命令行參數的指針數組 argv,最後是指向環境變量的指針數據 envp。在編寫彙編語言程序時,很多時候需要對這些參數進行處理,下面的代碼示範瞭如何在彙編代碼中進行命令行參數的處理:
例3. 處理命令行參數
用匯編編寫的程序雖然運行速度快,但開發速度非常慢,效率也很低。如果只是想對關鍵代碼段進行優化,或許更好的辦法是將彙編指令嵌入到 C 語言程序中,從而充分利用高級語言和彙編語言各自的特點。但一般來講,在 C 代碼中嵌入彙編語句要比"純粹"的彙編語言代碼複雜得多,因爲需要解決如何分配寄存器,以及如何與C代碼中的變量相結合等問題。
GCC 提供了很好的內聯彙編支持,最基本的格式是:
例如:
如果需要同時執行多條彙編語句,則應該用"\\n\\t"將各個語句分隔開,例如:
通常嵌入到 C 代碼中的彙編語句很難做到與其它部分沒有任何關係,因此更多時候需要用到完整的內聯彙編格式:
插入到 C 代碼中的彙編語句是以":"分隔的四個部分,其中第一部分就是彙編代碼本身,通常稱爲指令部,其格式和在彙編語言中使用的格式基本相同。指令部分是必須的,而其它部分則可以根據實際情況而省略。
在將彙編語句嵌入到C代碼中時,操作數如何與C代碼中的變量相結合是個很大的問題。GCC採用如下方法來解決這個問題:程序員提供具體的指令,而對寄存器的使用則只需給出"樣板"和約束條件就可以了,具體如何將寄存器與變量結合起來完全由GCC和GAS來負責。
在GCC 內聯彙編語句的指令部中,加上前綴''%''的數字(如%0,%1)表示的就是需要使用寄存器的"樣板"操作數。指令部中使用了幾個樣板操作數,就表明有幾個變量需要與寄存器相結合,這樣GCC和GAS在編譯和彙編時會根據後面給定的約束條件進行恰當的處理。由於樣板操作數也使用'' %''作爲前綴,因此在涉及到具體的寄存器時,寄存器名前面應該加上兩個''%'',以免產生混淆。
緊跟在指令部後面的是輸出部,是規定輸出變量如何與樣板操作數進行結合的條件,每個條件稱爲一個"約束",必要時可以包含多個約束,相互之間用逗號分隔開就可以了。每個輸出約束都以''=''號開始,然後緊跟一個對操作數類型進行說明的字後,最後是如何與變量相結合的約束。凡是與輸出部中說明的操作數相結合的寄存器或操作數本身,在執行完嵌入的彙編代碼後均不保留執行之前的內容,這是GCC在調度寄存器時所使用的依據。
輸出部後面是輸入部,輸入約束的格式和輸出約束相似,但不帶''=''號。如果一個輸入約束要求使用寄存器,則GCC在預處理時就會爲之分配一個寄存器,並插入必要的指令將操作數裝入該寄存器。與輸入部中說明的操作數結合的寄存器或操作數本身,在執行完嵌入的彙編代碼後也不保留執行之前的內容。
有時在進行某些操作時,除了要用到進行數據輸入和輸出的寄存器外,還要使用多個寄存器來保存中間計算結果,這樣就難免會破壞原有寄存器的內容。在GCC內聯彙編格式中的最後一個部分中,可以對將產生副作用的寄存器進行說明,以便GCC能夠採用相應的措施。
下面是一個內聯彙編的簡單例子:
例4.內聯彙編
上面的程序完成將變量a的值賦予變量b,有幾點需要說明:
在內聯彙編中用到的操作數從輸出部的第一個約束開始編號,序號從0開始,每個約束記數一次,指令部要引用這些操作數時,只需在序號前加上''%''作爲前綴就可以了。需要注意的是,內聯彙編語句的指令部在引用一個操作數時總是將其作爲32位的長字使用,但實際情況可能需要的是字或字節,因此應該在約束中指明正確的限定符:
|
Explanation of .cfi_def_cfa_offset
I would like an explanation for the values used with the .cfi_def_cfa_offset directives in assembly generated by GCC. I know vaguely that the .cfi directives are involved in call frames and stack unwinding, but I would like a more detailed explanation of why, for example, the values 16 and 8 are used in the assembly outputted by GCC in compiling the following C program on my 64-bit Ubuntu machine.
The C program:
#include <stdio.h>
int main(int argc, char** argv)
{
printf("%d", 0);
return 0;
}
I invoked GCC on the source file test.c as follows: gcc
-S -O3 test.c
. I know that -O3 enables nonstandard optimization, but I wanted to limit the size of the generated assembly for the sake of brevity.
The generated assembly:
.file "test.c"
.section .rodata.str1.1,"aMS",@progbits,1
.LC0:
.string "%d"
.text
.p2align 4,,15
.globl main
.type main, @function
main:
.LFB22:
.cfi_startproc
subq $8, %rsp
.cfi_def_cfa_offset 16
xorl %edx, %edx
movl $.LC0, %esi
movl $1, %edi
xorl %eax, %eax
call __printf_chk
xorl %eax, %eax
addq $8, %rsp
.cfi_def_cfa_offset 8
ret
.cfi_endproc
.LFE22:
.size main, .-main
.ident "GCC: (Ubuntu/Linaro 4.5.2-8ubuntu4) 4.5.2"
.section .note.GNU-stack,"",@progbits
Why are the values 16 and 8 used for the .cfi_def_cfa_offset directives in the generated assembly? Also, why is the number 22 used for the local function begin and function end labels?
看看老外的解釋:
|
As the DWARF spec says in section 6.4:
The value of
As the
Now we are running the code at
The change of stack pointer is declared in the debugging information using the
At the end of the function, the (The number "22" in the labels is just an arbitrary value. The compiler will generate unique label names based on some implementation detail, such as its internal numbering of basic blocks.) |
40
|
As the DWARF spec says in section 6.4:
The value of
As the
Now we are running the code at
The change of stack pointer is declared in the debugging information using the
At the end of the function, the (The number "22" in the labels is just an arbitrary value. The compiler will generate unique label names based on some implementation detail, such as its internal numbering of basic blocks.) |