C++程序中不同的函數調用方式

                                      C++程序中不同的函數調用方

C語言中,假設我們有這樣的一個函數:

int function(int a,int b)

調用時只要用result = function(1,2)這樣的方式就可以使用這個函數。但是,當高級

語言被編譯成計算機可以識別的機器碼時,有一個問題就凸現出來:在CPU中,計算機沒

有辦法知道一個函數調用需要多少個、什麼樣的參數,也沒有硬件可以保存這些參數。

也就是說,計算機不知道怎麼給這個函數傳遞參數,傳遞參數的工作必須由函數調用者

和函數本身來協調。爲此,計算機提供了一種被稱爲棧的數據結構來支持參數傳遞。

棧是一種先進後出的數據結構,棧有一個存儲區、一個棧頂指針。棧頂指針指向堆棧中

第一個可用的數據項(被稱爲棧頂)。用戶可以在棧頂上方向棧中加入數據,這個操作

被稱爲壓棧(Push),壓棧以後,棧頂自動變成新加入數據項的位置,棧頂指針也隨之修

改。用戶也可以從堆棧中取走棧頂,稱爲彈出棧(pop),彈出棧後,棧頂下的一個元素變

成棧頂,棧頂指針隨之修改。

函數調用時,調用者依次把參數壓棧,然後調用函數,函數被調用以後,在堆棧中取得

數據,並進行計算。函數計算結束以後,或者調用者、或者函數本身修改堆棧,使堆棧

恢復原裝。

在參數傳遞中,有兩個很重要的問題必須得到明確說明:

當參數個數多於一個時,按照什麼順序把參數壓入堆棧

函數調用後,由誰來把堆棧恢復原裝

在高級語言中,通過函數調用約定來說明這兩個問題。常見的調用約定有:

 

stdcall

cdecl

fastcall

thiscall

naked call

stdcall調用約定

stdcall很多時候被稱爲pascal調用約定,因爲pascal是早期很常見的一種教學用計算機

程序設計語言,其語法嚴謹,使用的函數調用約定就是stdcall。在Microsoft C++系列

C/C++編譯器中,常常用PASCAL宏來聲明這個調用約定,類似的宏還有WINAPICALLB

ACK

 

stdcall調用約定聲明的語法爲(以前文的那個函數爲例):

int __stdcall function(int a,int b)

stdcall的調用約定意味着:1)參數從右向左壓入堆棧,2)函數自身修改堆棧 3)函數

名自動加前導的下劃線,後面緊跟一個@符號,其後緊跟着參數的尺寸

以上述這個函數爲例,參數b首先被壓棧,然後是參數a,函數調用function(1,2)調用處

翻譯成彙編語言將變成:

 

push 2 第二個參數入棧

push 1 第一個參數入棧

call function 調用參數,注意此時自動把cs:eip入棧

 

而對於函數自身,則可以翻譯爲:

push ebp 保存ebp寄存器,該寄存器將用來保存堆棧的棧頂指針,可以在函數退出

時恢復

mov ebp,esp 保存堆棧指針

mov eax,[ebp + 8H] 堆棧中ebp指向位置之前依次保存有ebp,cs:eip,a,b,ebp +8指向

a

add eax,[ebp + 0CH] 堆棧中ebp + 12處保存了b

mov esp,ebp 恢復esp

pop ebp

ret 8

 

而在編譯時,這個函數的名字被翻譯成_function@8

注意不同編譯器會插入自己的彙編代碼以提供編譯的通用性,但是大體代碼如此。其中

在函數開始處保留espebp中,在函數結束恢復是編譯器常用的方法。

從函數調用看,21依次被push進堆棧,而在函數中又通過相對於ebp(即剛進函數時的

堆棧指針)的偏移量存取參數。函數結束後,ret 8表示清理8個字節的堆棧,函數自己

恢復了堆棧。

__stdcall有時也叫pascal調用約定,因爲被調用的函數負責清理堆棧,所以使用這種調用約定,清理堆棧的代碼只需要有一次(函數內部),所以總的代碼長度較__cdecl(c調用約定,調用者負責清理堆棧)來的小,但是因此也不能像c那樣支持可變參數列表。  

  所以的win32   API函數都使用__stdcall調用約定,實際上我們通常用APIENTRY宏來代替。  

  如果你用c/c++寫庫或者dll供其它語言編寫的程序(Delphi)調用,那麼就要聲明爲__stdcall  

  #define   APIENTRY   WINAPI  

  #define   WINAPI   __stdcall     

  一個例子:  

  c裏面的聲明:  

  extern   C   int   APIENTRY   resetPump()  

   

  Delphi的調用接口聲明:  

  Function   resetPump():integer;   stdcall;   External   'PumpDll.dll';  

 

cdecl調用約定

cdecl調用約定又稱爲C調用約定,是C語言缺省的調用約定,它的定義語法是:

int function (int a ,int b) //不加修飾就是C調用約定

int __cdecl function(int a,int b)//明確指出C調用約定

在寫本文時,出乎我的意料,發現cdecl調用約定的參數壓棧順序是和stdcall是一樣的

,參數首先由有向左壓入堆棧。所不同的是,函數本身不清理堆棧,調用者負責清理堆

棧。由於這種變化,C調用約定允許函數的參數的個數是不固定的,這也是C語言的一大

特色。對於前面的function函數,使用cdecl後的彙編碼變成:

調用處

push 1

push 2

call function

add esp,8 注意:這裏調用者在恢復堆棧

被調用函數_function

push ebp 保存ebp寄存器,該寄存器將用來保存堆棧的棧頂指針,可以在函數退出

時恢復

mov ebp,esp 保存堆棧指針

mov eax,[ebp + 8H] 堆棧中ebp指向位置之前依次保存有ebp,cs:eip,a,b,ebp +8指向

a

add eax,[ebp + 0CH] 堆棧中ebp + 12處保存了b

mov esp,ebp 恢復esp

pop ebp

ret 注意,這裏沒有修改堆棧

MSDN中說,該修飾自動在函數名前加前導的下劃線,因此函數名在符號表中被記錄爲_f

unction,但是我在編譯時似乎沒有看到這種變化。

由於參數按照從右向左順序壓棧,因此最開始的參數在最接近棧頂的位置,因此當採用

不定個數參數時,第一個參數在棧中的位置肯定能知道,只要不定的參數個數能夠根據

第一個後者後續的明確的參數確定下來,就可以使用不定參數,例如對於CRT中的sprin

tf函數,定義爲:

int sprintf(char* buffer,const char* format,...)

由於所有的不定參數都可以通過format確定,因此使用不定個數的參數是沒有問題的。

 

fastcall

fastcall調用約定和stdcall類似,它意味着:

函數的第一個和第二個DWORD參數(或者尺寸更小的)通過ecxedx傳遞,其他參數通過

從右向左的順序壓棧

被調用函數清理堆棧

函數名修改規則同stdcall

其聲明語法爲:int fastcall function(int a,int b)

 

thiscall

thiscall是唯一一個不能明確指明的函數修飾,因爲thiscall不是關鍵字。它是C++類成

員函數缺省的調用約定。由於成員函數調用還有一個this指針,因此必須特殊處理,th

iscall意味着:

參數從右向左入棧

如果參數個數確定,this指針通過ecx傳遞給被調用者;如果參數個數不確定,this指針

在所有參數壓棧後被壓入堆棧。

對參數個數不定的,調用者清理堆棧,否則函數自己清理堆棧

爲了說明這個調用約定,定義如下類和使用代碼:

class A

{

public:

int function1(int a,int b);

int function2(int a,...);

};

int A::function1 (int a,int b)

{

return a+b;

}

#include

int A::function2(int a,...)

{

va_list ap;

va_start(ap,a);

int i;

int result = 0;

for(i = 0 i < a i ++)

{

result += va_arg(ap,int);

}

return result;

}

void callee()

{

A a;

a.function1 (1,2);

a.function2(3,1,2,3);

}

 

callee函數被翻譯成彙編後就變成:

 

//函數function1調用

0401C1D push 2

00401C1F push 1

00401C21 lea ecx,[ebp-8]

00401C24 call function1 注意,這裏this沒有被入棧

//函數function2調用

00401C29 push 3

00401C2B push 2

00401C2D push 1

00401C2F push 3

00401C31 lea eax,[ebp-8] 這裏引入this指針

00401C34 push eax

00401C35 call function2

00401C3A add esp,14h

 

可見,對於參數個數固定情況下,它類似於stdcall,不定時則類似cdecl

naked call

這是一個很少見的調用約定,一般程序設計者建議不要使用。編譯器不會給這種函數增

加初始化和清理代碼,更特殊的是,你不能用return返回返回值,只能用插入彙編返回

結果。這一般用於實模式驅動程序設計,假設定義一個求和的加法程序,可以定義爲:

__declspec(naked) int add(int a,int b)

{

__asm mov eax,a

__asm add eax,b

__asm ret

}

注意,這個函數沒有顯式的return返回值,返回通過修改eax寄存器實現,而且連退出函

數的ret指令都必須顯式插入。上面代碼被翻譯成彙編以後變成:

mov eax,[ebp+8]

add eax,[ebp+12]

ret 8

 

注意這個修飾是和__stdcallcdecl結合使用的,前面是它和cdecl結合使用的代碼,對

於和stdcall結合的代碼,則變成:

__declspec(naked) int __stdcall function(int a,int b)

{

__asm mov eax,a

__asm add eax,b

__asm ret 8 //注意後面的8

}

至於這種函數被調用,則和普通的cdeclstdcall調用函數一致。

 

函數調用約定導致的常見問題

如果定義的約定和使用的約定不一致,則將導致堆棧被破壞,導致嚴重問題,下面是兩

種常見的問題:

函數原型聲明和函數體定義不一致

DLL導入函數時聲明瞭不同的函數約定

以後者爲例,假設我們在dll種聲明瞭一種函數爲:

__declspec(dllexport) int func(int a,int b);//注意,這裏沒有stdcall,使用的是

cdecl

使用時代碼爲:

typedef int (*WINAPI DLLFUNC)func(int a,int b);

hLib = LoadLibrary(...);

DLLFUNC func = (DLLFUNC)GetProcAddress(...)//這裏修改了調用約定

result = func(1,2);//導致錯誤

由於調用者沒有理解WINAPI的含義錯誤的增加了這個修飾,上述代碼必然導致堆棧被破

壞,MFC在編譯時插入的checkesp函數將告訴你,堆棧被破壞了。

 

作用:

 對於不同的語言,函數的調用規則可能有些不同,主要是各參數的壓棧序順序不同  
 比如有的語言再編譯爲最終代碼時將各參數從左向右依次壓棧,有的則正好相反,  
 從右向左壓棧。  
 在用某語言和其他語言進行混合編程時,如果兩者的順序不一樣,爲了保證調用正常進 行, 就要用到一些這樣的聲明。

 

補充材料:

其實看雪的書中已經提到這個問題了,只不過少了thiscallfastcall,thiscallVC++類成員默認的函數調用方式、fastcallC++Builder默認的調用方式,所以我在這裏做一個補充,方便大家查閱。

例子:

假設我們的函數爲:

int sumExample (int a, int b)

{

return a + b;

}

調用代碼爲: int c = sum (2, 3);

現在分別來看幾種不同的調用方式,調用者彙編代碼和函數體彙編代碼:

(1)_cdecl (C語言的調用方式)  ---------------

調用者代碼>>>

; // push arguments to the stack, from right to left

push        3   

push        2   

; // call the function

call        _sumExample

; // cleanup the stack by adding the size of the arguments to ESP register

add         esp,8

; // copy the return value from EAX to a local variable (int c)

mov         dword ptr [c],eax

 

函數體代碼>>>

; // function prolog

 push        ebp 

 mov         ebp,esp

 sub         esp,0C0h

 push        ebx 

 push        esi 

 push        edi 

 lea         edi,[ebp-0C0h]

 mov         ecx,30h

 mov         eax,0CCCCCCCCh

 rep stos    dword ptr [edi]

 

; //return a + b;

 mov         eax,dword ptr [a]

 add         eax,dword ptr [b]

 

; // function epilog

 pop         edi 

 pop         esi 

 pop         ebx 

 mov         esp,ebp

 pop         ebp 

 ret              

 

(2)__stdcall (Windows API 的調用方式) -----------------------

調用者代碼>>>

; // push arguments to the stack, from right to left

 push        3   

 push        2   

 

; // call the function

 call        _sumExample@8

 

; // copy the return value from EAX to a local variable (int c) 

 mov         dword ptr [c],eax

 

函數體代碼>>>

; // function prolog goes here (the same code as in the __cdecl example)

 

; //return a + b;

 mov         eax,dword ptr [a]

 add         eax,dword ptr [b]

 

; // function epilog goes here (the same code as in the __cdecl example)

 

; // cleanup the stack and return

 ret         8

 

 

(3)__fastcall(寄存器調用方式) -----------------------

調用者代碼>>>

; // put the arguments in the registers EDX and ECX

 mov         edx,3

 mov         ecx,2

 

; // call the function

 call        @fastcallSum@8

 

; // copy the return value from EAX to a local variable (int c) 

 mov         dword ptr [c],eax

 

函數體代碼>>>

; // function prolog

 

 push        ebp 

 mov         ebp,esp

 sub         esp,0D8h

 push        ebx 

 push        esi 

 push        edi 

 push        ecx 

 lea         edi,[ebp-0D8h]

 mov         ecx,36h

 mov         eax,0CCCCCCCCh

 rep stos    dword ptr [edi]

 pop         ecx 

 mov         dword ptr [ebp-14h],edx

 mov         dword ptr [ebp-8],ecx

; // return a + b;

 mov         eax,dword ptr [a]

 add         eax,dword ptr [b]

;// function epilog 

 pop         edi 

 pop         esi 

 pop         ebx 

 mov         esp,ebp

 pop         ebp 

 ret              

 

(4)thiscall(C++類成員函數調用方式) -----------------------

這個比較特殊,函數是某個類的成員,所以我們這樣定義:

class CSum //類定義

{

int sum ( int a, int b) {return a+b;}

};

 

調用者代碼>>>

push        3    

push        2   

lea         ecx,[sumObj]

call        ?sum@CSum@@QAEHHH@Z; CSum::sum

mov         dword ptr [s4],eax

 

函數體代碼>>>

 push        ebp 

 mov         ebp,esp

 sub         esp,0CCh

 push        ebx 

 push        esi 

 push        edi 

 push        ecx 

 lea         edi,[ebp-0CCh]

 mov         ecx,33h

 mov         eax,0CCCCCCCCh

 rep stos    dword ptr [edi]

 pop         ecx 

 mov         dword ptr [ebp-8],ecx

 mov         eax,dword ptr [a]

 add         eax,dword ptr [b]

 pop         edi 

 pop         esi 

 pop         ebx 

 mov         esp,ebp

 pop         ebp 

 ret         8    

總結: 4call基本上是C++程序(Visual C++ ,C++Builder)最常見的調用方式,熟練掌握這幾種call的調用者與函數體的彙編代碼格式有助於更快分析算法,寫註冊機。所以我簡單列舉在這裏,不足的地方還請大家補充,錯誤的地方還請批評指正!

 

 

 

 

 

 

 

 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章