解析VC++ Name Mangling 機制

解析VC++ Name Mangling 機制

 

摘要

C++中,Name Mangling 是爲了支持重載而加入的一項技術,目前C++ Name Mangling 並沒有統一的標準,也沒有較完整的中文文檔化資料,所以本篇文章在VS2005環境中,解析C++ Name Mangling 的技術細節,以及怎樣將VC Name Mangling後的名稱還原爲可讀的形式。

 

目錄

l        Name Mangling 簡介

 

l        VC環境中Name Mangling

 

n         VC環境中C 語言的 Name Mangling

n         VC環境中C++ 語言中的 Name Mangling

l        Name Mangling 後的名稱還原爲可讀的形式

 

 

Name Mangling 簡介

Name Mangling 是一種在編譯過程中,將函數、變量的名稱重新改編的機制。在 C++重載、namespace等操作符下,函數可以有同樣的名字,編譯器爲了區分各個不同地方的函數,將各個函數通過編譯器內定的算法,將函數改成唯一的名稱。

Name Mangling翻譯成中文意思爲:名字修飾、名字改編等,由於對這個翻譯沒有統一的約定,所以本文中採用英文表示。

在寫VC++程序時,我們有時會遇到類似於error LNK2019: unresolved external symbol "void __cdecl MyFun (void)" (?MyFun@@YAXXZ) referenced in function _wmain”的連接錯誤,此語句中“?MyFun@@YAXXZ”是VC Name Mangling後的結果。本文主要討論Name Mangling 後名稱還原爲可讀的方式。

本文首先討論 VC 環境中,C/C++ 語言的 Name Mangling 算法機制。然後討論手動將 C++ 語言 Name Mangling 後的字符串轉換爲函數的定義式,最後編碼實現還原。

 

VC環境中Name Mangling

VC中,微軟採用了自己獨特的Name Mangling技術,當然微軟也爲此Name Mangling技術申請了專利。

想要查看 VC 將函數名稱 Name Mangling 的結果,只需將函數聲明,不實現,然後調用之即可。

下面先討論VC環境中C語言的Name Mangling技術,然後再討論C++

 

VC環境中C 語言的 Name Mangling

    VC中,也可以採用C語言編譯器,只需要如下設置:Project à Property…à Configuration Properties à C/C++ à Advanced à Compile As,將其設爲“(/TC)”即可。至於文件後綴是否爲cppVC並不關心。

C 語言中,函數可以有如下聲明方式(其中 __CALLTYPE 可以爲 __cdecl__stdcall__fastcall等)[1]

1void __CALLTYPE fun();

2int __CALLTYPE fun();

3int __CALLTYPE fun(int);

4double __CALLTYPE fun(int, double);

5int* __CALLTYPE fun(int*, char*);

我們先假設此處 CALLTYPE __cdecl(即:#define __CALLTYPE __cdecl),在 VC 中,Name Mangling 結果如下:

1_fun

2_fun

3_fun

4_fun

5_fun

       由此可見,在 VC 編譯 C 語言時(__cdecl),僅僅在函數名前加“_”。

我們再看看其他調用方式,如:__stdcall#define __CALLTYPE __stdcall),結果如下:

       1_fun@0

    2_fun@0

       3_fun@4

       4_fun@12

    5_fun@8

    最後,我們看看 __fastcall 的結果(#define __CALLTYPE __ fastcall):

1@fun@0

2@fun@0

3@fun@4

4@fun@12

5@fun@8

由此,我們可以得出結論,從被 Name Mangling 後的字符串推斷出原來的函數名。

1__cdecl

在此聲明方式下,僅僅在函數名前加一個下劃線,至於函數返回值、參數,完全沒有處理。

2__stdcall

在此聲明方式下,在函數名前加一個下劃線,然後緊跟“@”符號,最後是函數參數大小總和(注意:此總和包含了字節填充)。

3__fastcall

在此聲明方式下,跟 __stdcall 唯一不同的是,函數前面的下劃線變爲了“@”符號。

 

由上面 5 個實例函數,我們大概可以看到 VC 環境中,C 語言 Name Mangling 技術了,但也可以發現,從 Name Mangling 後的字符串,並不能得出函數原來的定義式。不同的定義式,Name Mangling 後的名稱可以相同,由此也可以知道,C 語言不支持函數重載。

號線stdcall

函數名:cl----------------------------------------

 

VC環境中C++ 語言中的 Name Mangling

C++ 語言中,函數需要支持重載,新增命名空間函數調用、類函數調用、運算符重載、模板函數等等,所以情況也比 C 語言複雜很多。

下面我們列舉一些函數例子進行分析,函數可以有如下聲明方式(其中 __CALLTYPE 可以爲 __cdecl__stdcall__fastcall等)[1]

1void __CALLTYPE fun();

2int __CALLTYPE fun();

3int __CALLTYPE fun(int);

4double __CALLTYPE fun(int, double);

5int* __CALLTYPE fun(int*, char*);

6class ABCD

{

public:

        int __CALLTYPE fun();

};

7template<typename T>

int fun(typename T);

我們仍先假設此處 CALLTYPE __cdecl(即:#define __CALLTYPE __cdecl),在 VC 中,Name Mangling 結果如下:

       1?fun@@YAXXZ

2?fun@@YAHXZ

3?fun@@YAHH@Z

    4?fun@@YANHN@Z

    5?fun@@YAPAHPAHPAD@Z

    6?fun@ABCD@@QAAHXZ

    7??$fun@H@@YAHH@Z

由此可見,C++ Name Mangling 技術比 C 語言的複雜很多。

我們挑選第一條分析一下,“?”表示一個函數的開始,用以區別於 C 語言的“_”,fun 爲函數名稱,“@@YA”表示函數調用約定爲 __cdecl,“X”表示函數的參數爲空,“XZ”爲結束標識。

將上述名稱還原爲可讀方式並不複雜,但要記住這些規則,考慮到所有組合方式卻是一件比較複雜的事情,下面我們來看看一個比較複雜的函數調用,聲明函數如下:

int funconst CString&, const std::vector&;

Name Mangling 後的結果爲:

?fun@@YAHABV?$CStringT@_WV?$StrTraitATL@_WV?$ChTraitsCRT@_W@ATL@@@ATL@@@ATL@@ABV?$vector@NV?$allocator@N@std@@@std@@@Z

如此長的一串,用人腦來直接分析顯然不符合實際,好在 Windows 提供了 API 函數用於解析字符串,具體解析辦法,下面一節將詳細解釋。

 

Name Mangling 後的名稱還原爲可讀的形式

Windows DbgHelp.dll 導出函數中,UnDecorateSymbolName 是用於解析 Name Mangling 字符串的,具體函數的細節可以查看 MSDN。如下爲實例代碼:

void UnDecorateName()

{

    char szDecorateName[1024] = {0};

    char szUnDecorateName[2048] = {0};

    printf("Please Input Decorated Name: ");

    scanf("%s", szDecorateName);

 

   if (UnDecorateSymbolName(szDecorateName, szUnDecorateName, sizeof(szUnDecorateName), UNDNAME_COMPLETE) == 0)

    {

        printf("UnDecorateSymbolName Failed. GetLastError() = %d", GetLastError());

        getchar();

        return;

    }

 

    printf("The UnDecorated Name Is: %s/r/n", szUnDecorateName);

    getchar();

    return;

}

 

Xp 中當我們輸入如上的:?fun@@YAPAHPAHPAD@Z

程序得出的結果爲:int * __cdecl fun(int *,char *)

注意:在 Xp 中,帶有模板的 Name Mangling 字符串無法直接還原,如需還原,可以在 VistaWin7 中運行此程序。

 

 

---------------------------------------------------------

[1]:關於函數調用約定的細節,可以查看我寫的另一篇文章:“C/C++函數調用約定”。地址:http://blog.csdn.net/xt_xiaotian/archive/2010/03/10/5363633.aspx

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章