【轉】C/C++函數的系統調用的幾種方式

【轉自】:http://blog.csdn.net/sunshinewave/article/details/7981034#comments

我們知道,調用函數時,計算機常用棧來存放函數執行需要的參數,由於棧的空間大小是有限的,在windows下棧是向低地址擴展的數據結構,是一塊連續的內存區域。這句話的意思是棧頂的地址和棧的最大容量是系統預先規定好的,windows下棧的大小是2M(也有的說是1M),如果申請的空間超過棧的剩餘空間時,將提示overflow。
在函數調用時,第一個進棧的是主函數中後的下一條指令(函數調用語句的下一條可執行語句)的地址,然後是函數的各個參數,在大多數的C編譯器中,參數是由右往左入棧的,然後是函數中的局部變量。注意靜態變量是不入棧的。
在參數傳遞中,有兩個重要的問題必須要明確說明:
1. 當參數個數多於一個時,按照什麼順序把參數壓入堆棧;
2. 函數調用後,由誰來把堆棧恢復原狀。
在高級語言中,就是通過函數的調用方式來說明這兩個問題的。常見的調用方式有:
stdcall
cdecl
fastcall
thiscall
thiscall
naked call
下面就分別介紹這幾種調用方式:
1. stdcall
stdcall調用方式又被稱爲Pascal調用方式。在Microsoft C++系列的C/C++編譯器中,使用PASCAL宏,WINAPI宏和CALLBACK宏來指定函數的調用方式爲stdcall。
stdcall調用方式的函數聲明爲:
int _stdcall function(int a, int b);
stdcall的調用方式意味着:
(1) 參數從右向左依次壓入堆棧
(2) 由被調用函數自己來恢復堆棧
(3) 函數名自動加前導下劃線,後面緊跟着一個@,其後緊跟着參數的尺寸
上面那個函數翻譯成彙編語言將變成:
push b 先壓入第二個參數
push a 再壓入第一個參數
call function 調用函數
在編譯時,此函數的名字被翻譯爲_function@8 
2. cdecl
cdecl調用方式又稱爲C調用方式,是C語言缺省的調用方式,它的語法爲:
int function(int a, int b) // 不加修飾符就是C調用方式
int _cdecl function(int a, int b) // 明確指定用C調用方式
cdecl的調用方式決定了:
(1) 參數從右向左依次壓入堆棧
(2) 由調用者恢復堆棧
(3) 函數名自動加前導下劃線
由於是由調用者來恢復堆棧,因此C調用方式允許函數的參數個數是不固定的,這是C語言的一大特色。
此方式的函數被翻譯爲:
push b // 先壓入第二個參數
push a // 在壓入第一個參數
call funtion // 調用函數
add esp, 8 // 清理堆棧 。。。。。需要熟悉一下esp寄存器的功能,建議看一下彙編有關的書,基本都有講
在編譯時,此方式的函數被翻譯成:_function
3. fastcall
fastcall 按照名字上理解就可以知道,它是一種快速調用方式。此方式的函數的第一個和第二個DWORD參數通過ecx和edx傳遞,
後面的參數從右向左的順序壓入棧。
被調用函數清理堆棧。
函數名修個規則同stdcall
其聲明語法爲:
int fastcall function(int a, int b);
4. thiscall
thiscall 調用方式是唯一一種不能顯示指定的修飾符。它是c++類成員函數缺省的調用方式。由於成員函數調用還有一個this指針,因此必須用這種特殊的調用方式。
thiscall調用方式意味着:
參數從右向左壓入棧。
如果參數個數確定,this指針通過ecx傳遞給被調用者;如果參數個數不確定,this指針在所有參數壓入棧後被壓入棧。
參數個數不定的,由調用者清理堆棧,否則由函數自己清理堆棧。
可以看到,對於參數個數固定的情況,它類似於stdcall,不定時則類似於cdecl。
5. naked call
是一種比較少見的調用方式,一般高級程序設計語言中不常見。
函數的聲明調用方式和實際調用方式必須一致,必然編譯器會產生混亂。
函數名字修改規則:
1. C編譯時函數名修飾約定規則:
__stdcall調用約定在輸出函數名前加上一個下劃線前綴,後面加上一個“@”符號和其參數的字節數,格式爲_function@8。
__cdecl調用約定僅在輸出函數名前加上一個下劃線前綴,格式爲_function。
__fastcall調用約定在輸出函數名前加上一個“@”符號,後面也是一個“@”符號和其參數的字節數,格式爲@function@8。
它們均不改變輸出函數名中的字符大小寫,這和PASCAL調用約定不同,PASCAL約定輸出的函數名無任何修飾且全部大寫。
2. C++編譯時函數名修飾約定規則:
__stdcall調用約定:
(1)以“?”標識函數名的開始,後跟函數名;
(2)函數名後面以“@@YG”標識參數表的開始,後跟參數表;
(3)參數表以代號表示:
X--void ,
D--char,
E--unsigned char,
F--short,
H--int,
I--unsigned int,
J--long,
K--unsigned long,
M--float,
N--double,
_N--bool,
....
PA--表示指針,後面的代號表明指針類型,如果相同類型的指針連續出現,以“0”代替,一個“0”代
表一次重複;
(4)參數表的第一項爲該函數的返回值類型,其後依次爲參數的數據類型,指針標識在其所指數據類型前;
(5)參數表後以“@Z”標識整個名字的結束,如果該函數無參數,則以“Z”標識結束。
其格式爲“?functionname@@YG*****@Z”或“?functionname@@YG*XZ”,例如
int Test1(char *var1,unsigned long)-----“?Test1@@YGHPADK@Z”
void Test2() -----“?Test2@@YGXXZ”
__cdecl調用約定:
規則同上面的_stdcall調用約定,只是參數表的開始標識由上面的“@@YG”變爲“@@YA”。
__fastcall調用約定:
規則同上面的_stdcall調用約定,只是參數表的開始標識由上面的“@@YG”變爲“@@YI”。
VC++對函數的省缺聲明是"__cedcl",將只能被C/C++調用。



——————————————————————————————————————————————————————————————————————


4. 名字修飾約定

"C" 或者 "C++" 函數在內部(編譯和鏈接)通過修飾名識別。修飾名是編譯器在編譯函數定義或者原型時生成的字符串。有些情況下使用函數的修飾名是必要的,如在模塊定義文件裏頭指定輸出"C++"重載函數、構造函數、析構函數,又如在彙編代碼裏調用"C""或"C++"函數等。修飾名由函數名、類名、調用約定、返回類型、參數等共同決定。函數名修飾約定隨編譯種類(C或C++)和調用約定的不同而不同,下面分別說明。

 

C編譯時函數名修飾約定規則:

__stdcall調用約定:

    在輸出函數名前加上一個下劃線前綴,後面加上一個"@"符號和其參數的字節數,格式爲 _functionname@number。

__cdecl調用約定:

    僅在輸出函數名前加上一個下劃線前綴,格式爲 _functionname。

__fastcall調用約定:

    在輸出函數名前加上一個"@"符號,後面也是一個"@"符號和其參數的字節數,格式爲@functionname@number。

它們均不改變輸出函數名中的字符大小寫。

 

C++編譯時函數名修飾約定規則:

__stdcall調用約定:

以"?"標識函數名的開始,後跟函數名;函數名後面以"@@YG"標識參數表的開始,後跟參數表;

參數表以代號表示:

    X——void,

    D——char,

    E——unsigned char,

    F——short,

    H——int,

    I——unsigned int,

    J——long,

    K——unsigned long,

    M——float,

    N——double,

    _N——bool,

    ....

    PA——表示指針,後面的代號表明指針類型,如果相同類型的指針連續出現,以"0"代替,一個"0"代表一次重複;

 

參數表的第一項爲該函數的返回值類型,其後依次爲參數的數據類型,指針標識在其所指數據類型前。

參數表後以"@Z"標識整個名字的結束,如果該函數無參數,則以"Z"標識結束。其格式爲

    "?functionname@@YG*****@Z" 或 "?functionname@@YG*XZ",

    例如

    int Test1(char *var1,unsigned long)    -----“?Test1@@YGHPADK@Z”

    void Test2()    -----“?Test2@@YGXXZ”(第一個X表示返回類型,第二個X表示參數類型)

 

__cdecl調用約定:

    規則同上面的_stdcall調用約定,只是參數表的開始標識由上面的"@@YG"變爲"@@YA"。VC++對函數的省缺聲明是"__cedcl",將只能被C/C++調用。

 

__fastcall調用約定:

    規則同上面的_stdcall調用約定,只是參數表的開始標識由上面的"@@YG"變爲"@@YI"。

對於C++的類成員函數(其調用方式是thiscall),函數的名字修飾與非成員的C++函數稍有不同,首先就是在函數名字和參數表之間插入以“@”字符引導的類名;其次是參數表的開始標識不同,公有(public)成員函數的標識是“@@QAE”,保護(protected)成員函數的標識是“@@IAE”,私有(private)成員函數的標識是“@@AAE”,如果函數聲明使用了const關鍵字,則相應的標識應分別爲“@@QBE”,“@@IBE”和“@@ABE”。如果參數類型是類實例的引用,則使用“AAV1”,對於const類型的引用,則使用“ABV1”。下面就以類CTest爲例說明C++成員函數的名字修飾規則:

class CTest

{

......

private:

    void Function(int);

protected:

    void CopyInfo(const CTest &src);

public:

    long DrawText(HDC hdc, long pos, const TCHAR* text, RGBQUAD color, BYTE bUnder, bool bSet);

    long InsightClass(DWORD dwClass) const;

......

};

對於成員函數Function,其函數修飾名爲“?Function@CTest@@AAEXH@Z”,字符串“@@AAE”表示這是一個私有函數。“X”表示返回類型爲void,“H”表示參數類型爲int類型。

 

成員函數CopyInfo只有一個參數,是對類CTest的const引用參數,其函數修飾名爲“?CopyInfo@CTest@@IAEXABV1@@Z”。

 

DrawText是一個比較複雜的函數聲明,不僅有字符串參數,還有結構體參數和HDC句柄參數,需要指出的是HDC實際上是一個HDC__結構類型的指針,這個參數的表示就是“PAUHDC__@@”,其完整的函數修飾名爲“?DrawText@CTest@@QAEJPAUHDC__@@JPBDUtagRGBQUAD@@E_N@Z”。

 

InsightClass是一個共有的const函數,它的成員函數標識是“@@QBE”,完整的修飾名就是“?InsightClass@CTest@@QBEJK@Z”。

 

舉例

比如動態鏈接庫a有以下導出函數:

long MakeFun(long lFun);

動態庫生成的時候採用的函數調用約定是__stdcall,所以編譯生成的a.dll中函數MakeFun的調用約定是_stdcall,也就是函數調用時參數從右向左入棧,函數返回時自己還原堆棧。現在某個程序模塊b要引用a中的MakeFun,b和a一樣使用C++方式編譯,只是b模塊的函數調用方式是__cdecl,由於b包含了a提供的頭文件中MakeFun函數聲明,所以MakeFun在b模塊中被其它調用MakeFun的函數認爲是__cdecl調用方式,b模塊中的這些函數在調用完MakeFun當然要幫着恢復堆棧啦,可是MakeFun已經在結束時自己恢復了堆棧,b模塊中的函數這樣多此一舉就引起了棧指針錯誤,從而引發堆棧異常。宏觀上的現象就是函數調用沒有問題(因爲參數傳遞順序是一樣的),MakeFun也完成了自己的功能,只是函數返回後引發錯誤。解決的方法也很簡單,只要保證兩個模塊的在編譯時設置相同的函數調用約定就行了。

 

現在再假定兩個模塊在編譯的時候都採用__stdcall調用約定,但是a.dll使用C語言的語法編譯的(C語言方式),所以a.dll的載入庫a.lib中MakeFun函數的名字修飾就是“_MakeFun@4”。b包含了a提供的頭文件中MakeFun函數聲明,但是由於b採用的是C++語言編譯,所以MakeFun在b模塊中被按照C++的名字修飾規則命名爲“?MakeFun@@YGJJ@Z”,編譯過程相安無事,鏈接程序時c++的鏈接器就到a.lib中去找“?MakeFun@@YGJJ@Z”,但是a.lib中只有“_MakeFun@4”,沒有“?MakeFun@@YGJJ@Z”,於是鏈接器就報告:

error LNK2001: unresolved external symbol ?MakeFun@@YGJJ@Z

解決的方法和簡單,就是要讓b模塊知道這個函數是C語言編譯的,extern "C"可以做到這一點。一個採用C語言編譯的庫應該考慮到使用這個庫的程序可能是C++程序(使用C++編譯器),所以在設計頭文件時應該注意這一點。通常應該這樣聲明頭文件:

#ifdef _cplusplus

extern "C" {

#endif

long MakeFun(long lFun);

#ifdef _cplusplus

}

#endif

這樣C++的編譯器就知道MakeFun的修飾名是“_MakeFun@4”,就不會有鏈接錯誤了。

 

許多人不明白,爲什麼我使用的編譯器都是VC的編譯器還會產生“error LNK2001”錯誤?其實,VC的編譯器會根據源文件的擴展名選擇編譯方式,如果文件的擴展名是“.C”,編譯器會採用C的語法編譯,如果擴展名是“.cpp”,編譯器會使用C++的語法編譯程序,所以,最好的方法就是使用extern "C"。

5. 單看函數的名字修飾

有兩種方式可以檢查你的程序中的函數的名字修飾:使用編譯輸出列表或使用Dumpbin工具。使用/FAc,/FAs或/FAcs命令行參數可以讓編譯器輸出函數或變量名字列表。使用dumpbin.exe /SYMBOLS命令也可以獲得obj文件或lib文件中的函數或變量名字列表。此外,還可以使用 undname.exe 將修飾名轉換爲未修飾形式。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章