在Visual C++中使用內聯彙編(_emit)

個人推薦:如果win32的話,建議win32彙編!

一、內聯彙編的優缺點


  因爲在Visual C++中使用內聯彙編不需要額外的編譯器和聯接器,且可以處理Visual C++中不能處理的一些事情,而且可以使用在C/C++中的變量,所以非常方便。內聯彙編主要用於如下場合:

  1.使用彙編語言寫函數;
  2.對速度要求非常高的代碼;
  3.設備驅動程序中直接訪問硬件;
  4."Naked" Call的初始化和結束代碼。

  //(."Naked",理解了意思,但是不知道怎麼翻譯^_^,大概就是不需要C/C++的編譯器(自作聰明)生成的函數初始化和收尾代碼,請參看MSDN的"Naked Functions"的說明)

  內聯彙編代碼不易於移植,如果你的程序打算在不同類型的機器(比如x86和Alpha)上運行,應當儘量避免使用內聯彙編。這時候你可以使用MASM,因爲MASM支持更方便的的宏指令和數據指示符。

  二、內聯彙編關鍵字

  在Visual C++使用內聯彙編用到的是__asm關鍵字,這個關鍵字有兩種使用方法:

  1.簡單__asm塊

__asm
{
MOV AL, 2
MOV DX, 0XD007
OUT AL, DX
}

  2.在每條彙編指令之前加__asm關鍵字

__asm MOV AL, 2
__asm MOV DX, 0xD007
__asm OUT AL, DX

  因爲__asm關鍵字是語句分隔符,因此你可以把彙編指令放在同一行:

  __asm MOV AL, 2 __asm MOV DX, 0XD007 __asm OUT AL, DX

  顯然,第一種方法和C/C++的風格很一致,並且有很多其它優點,因此推薦使用第一種方法。

  不象在C/C++中的"{}",__asm塊的"{}"不會影響C/C++變量的作用範圍。同時,__asm塊可以嵌套,嵌套也不會影響變量的作用範圍。

  三、在__asm塊中使用彙編語言

  1.內聯彙編指令集

  內聯彙編完全支持的Intel 486指令集,允許使用MMX指令。不支持的指令可以使用_EMIT僞指令定義(_EMIT僞指令說明見下文)。

  2.MASM表達式

  內聯彙編可以使用MASM中的表達式。比如: MOV EAX, 1。

  3.數據指示符和操作符

  雖然__asm塊中允許使用C/C++的數據類型和對象,但它不能用MASM指示符和操作符定義數據對象。這裏特別指出,__asm塊中不允許MASM中的定義指示符: DB、DW、DD、DQ、DT和DF,也不允許DUP和THIS操作符。MASM結構和記錄也不再有效,內聯彙編不接受STRUC、RECORD、WIDTH或者MASK。

  4.EVEN和ALIGN指示符

  儘管內聯彙編不支持大多數MASM指示符,但它支持EVEN和ALIGN,當需要的時候,這些指示符在彙編代碼裏面加入NOP(空操作)指令使標號對齊到特定邊界。這樣可以使某些處理器取指令時具有更高的效率。

  5.MASM宏指示符

  內聯彙編不是宏彙編,不能使用MASM宏指示符(MACRO、REPT、IRC、IRP和ENDM)和宏操作符(<>、!、&、%和.TYPE)。

  6.段說明

  必須使用寄存器來說明段,跨越段必須顯式地說明,如ES:[BX]。

  7.類型和變量大小

  我們可以使用LENGTH來取得C/C++中的數組中的元素個數,如果不是一個數組,則結果爲一。使用SIZE來取得C/C++中變量的大小,一個變量的大小是LENGTH和TYPE的乘積。TYPE用來取得一個變量的大小,如果是一個數組,它得到的一個數組中的單個元素的大小。

  8.註釋

  可以使用C/C++的註釋,但推薦用ASM的註釋,即";"號。

  9._EMIT僞指令

  _EMIT僞指令相當於MASM中的DB,但一次只能定義一個字節,比如:

__asm
{
JMP _CodeOfAsm

_EMIT 0x00 ; 定義混合在代碼段的數據
_EMIT 0x01

_CodeOfAsm:
; 這裏是代碼
_EMIT 0x90 ; NOP指令
}
  四、在__asm塊中使用C/C++語言元素

  C/C++與彙編可以混合使用,在內聯彙編可以使用C/C++的變量和很多其它C/C++的元素。在__asm塊中可以使用以下C/C++元素:

  1.符號,包括標號、變量和函數名;

  2.常量,包括符號常量和枚舉型(enum)成員;

  3.宏定義和預處理指示符;

  4.註釋,包括"/**/"和"//";

  5.類型名,包括所有MASM中合法的類型

  6.typedef名稱, 像PTR、TYPE、特定的結構成員或枚舉成員這樣的通用操作符。

  在__asm塊中,可以使用C/C++或ASM的基數計數法(比如: 0x100和100H是相等的)。

  __asm塊中不能使用像<<一類的C/C++操作符。C/C++和MASM通用的操作符,比如"*"和"[]"操作符,都被認爲是彙編語言的操作符。舉個例子:

int array[10];

__asm MOV array[6], BX ; Store BX at array+6 (not scaled)

array[6] = 0; /* Store 0 at array+12 (scaled) */

  * 小技巧: 內聯彙編中,你可以使用TYPE操作符使作其與C一致。比如,下面兩條語句是一樣的:

__asm MOV array[6 * TYPE int], 0 ; Store 0 at array + 12

array[6] = 0; /* Store 0 at array + 12 */

  內聯彙編能通過變兩名直接引用C/C++的變量。__asm塊中可以引用任何符號,包括變量名。

  如果C/C++中的類、結構或者枚舉成員具有唯一的名稱,如果在"."操作符之前不指定變量或者typedef名稱,則__asm塊中只能引用成員名稱。然而,如果成員不是唯一的,你必須在"."操作符之前加上變量名或typedef名稱。例如,下面的兩個結構都具有same_name這個成員變量:

struct first_type
{
char *weasel;
int same_name;
};

struct second_type
{
int wonton;
long same_name;
};

  如果按下面聲明變量:

struct first_type hal;
struct second_type oat;

  那麼,所有引用same_name成員的地方都必須使用變量名,因爲same_name不是唯一的。另外,上面的weasel變量具有唯一的名稱,你可以僅僅使用它的成員名稱來引用它:

__asm
{
MOV EBX, OFFSET hal
MOV ECX, [EBX]hal.same_name ; 必須使用 'hal'
MOV ESI, [EBX].weasel ; 可以省略 'hal'
}

  注意,省略了變量名僅僅是爲了寫代碼的方便,生成的彙編指令的還是一樣的。

  可以不受限制地訪問C++成員變量,但是不能調用C++的成員函數。

  五、寄存器使用

  一般來說,在__asm塊開始的時候,寄存器是空的,不能在兩個__asm之間保存寄存器的值。(這是MSDN上說的,我在實際使用時發現,好像並不是這樣。不過它是說"一般",我是特殊:))

  如果一個函數被聲明成了__fastcall,則其參數將放在寄存器中,這將給寄存器的管理帶來問題。所以,如果要將一個函數聲明成__fastcall,必須保存ECX寄存器。爲了避免以上的衝突,在聲明爲__fastcall的函數中不要有__asm塊。如果用了/Gr編譯選項(它全局的變成__fastcall),將每個函數聲明成__cdecl或者__stdcall,這個屬性告訴編譯器用傳統的C方法。

  如果使用EAX、EBX、ECX、EDX、ESI和EDI寄存器,你不需要保存它;但如果你用到了DS、 SS、SP、BP和標誌寄存器,那就應該PUSH保存這些寄存器。

  如果程序中改變了用於STD和CLD的方向標誌,你必須將其恢復到原來的值。

  六、轉跳

  可以在C裏面使用goto調到__asm塊中的標號處,也可以在__asm塊中轉跳到__asm塊裏面和外面的標號處。__asm塊內的標號是不區分大小寫的(指令、指示符等也是不區分大小寫的)。例:

void func()
{
goto C_Dest; /* 合法 */
goto c_dest; /* 錯誤 */

goto A_Dest; /* 合法 */
goto a_dest; /* 合法 */

__asm
{
JMP C_Dest ; 合法
JMP c_dest ; MSDN上說合法,但是我在VS.NET中編譯,認爲這樣不合法

JMP A_Dest ; 合法
JMP a_dest ; 合法

a_dest: ; __asm 標號
}

C_Dest: /* C的標號 */
return;
}

  不要使用函數名稱當作標號,否則將使其跳到函數執行而不是標號處。如下所示:

; 錯誤: 使用函數名作爲標號
JNE exit
.
.
.
exit:
; 下面是更多的ASM代碼

  美元符號$用於指定當前位置,如下所用,常用於條件跳轉:

JNE $+5 ; 下面這條指令的長度是5個字節
JMP farlabel
;$+5,跳到了這裏
.
.
.
farlabel:
七、調用函數

  內聯彙編調用C/C++函數必須自己清除堆棧,下面是一個調用C/C++函數例子:

#include

char szformat[] = "%s %s\n";
char szHello[] = "Hello";
char szWorld[] = " world";
void main()
{
__asm
{
MOV EAX, OFFSET szWorld
PUSH EAX
MOV EAX, OFFSET szHello
PUSH EAX
MOV EAX, OFFSET szformat
PUSH EAX
CALL printf

//內聯彙編調用C函數必須自己清除堆棧
//用不使用的EBX寄存器清除堆棧,或ADD ESP, 12
POP EBX
POP EBX
POP EBX
}
}

  注意:函數參數是從右向左壓棧。

  不能夠訪問C++中的類成員函數,但是可以訪問extern "C"函數。

  如果調用Windows API函數,則不需要自己清除堆棧,因爲API的返回指令是RET n,會自動清除堆棧

  比如下面的例子:

#include

char szAppName[] = "API Test";

void main()
{
char szHello[] = "Hello, world!";

__asm
{
PUSH MB_OK OR MB_ICONINformATION
PUSH OFFSET szAppName ; 全局變量用OFFSET
LEA EAX, szHello ; 局部變量用LEA
PUSH EAX
PUSH 0
CALL DWORD PTR [MessageBoxA] ; 注意這裏,我費了好大週摺才發現不是CALL MessageBoxA
}
}

  一般來說,在Visual C++中使用內聯彙編是爲了提高速度,因此這些函數調用儘可能用C/C++寫。

  八、一個例子

  下面的例子是在VS.NET(即VC7)中C語言寫的。先建一個工程,將下列代碼放到工程中的.c文件中編譯,無需作特別的設置,即可編譯通過。

////////////////////////////////////////////////////////////////////////
//預處理
#include
///////////////////////////////////////////////////////////////////////

///////////////////////////////////////////////////////////////////////
//全局變量
HWND g_hWnd;
HINSTANCE g_hInst;

TCHAR szTemp[1024];

TCHAR szAppName[] = "CRC32 Sample";
/////////////////////////////////////////////////////////////////////

/////////////////////////////////////////////////////////////////////
//函數聲明
DWORD GetCRC32(const BYTE *pbData, int nSize);
int WINAPI WinMain(HINSTANCE hInstance, HINSTANCE hPrevInstance, LPSTR lpCmdLine, int iCmdShow);
LRESULT CALLBACK WindowProc(HWND hWnd, UINT uMsg, WPARAM wParam, LPARAM lParam);
/////////////////////////////////////////////////////////////////////

/////////////////////////////////////////////////////////////////////
//主函數
int WINAPI WinMain(HINSTANCE hInstance, HINSTANCE hPrevInstance, LPSTR lpCmdLine, int iCmdShow)
{
MSG msg;
WNDCLASSEX wndClassEx;

g_hInst = hInstance;

wndClassEx.cbSize = sizeof(WNDCLASSEX);
wndClassEx.style = CS_VREDRAW | CS_HREDRAW;
wndClassEx.lpfnWndProc = (WNDPROC) WindowProc;
wndClassEx.cbClsExtra = 0;
wndClassEx.cbWndExtra = 0;
wndClassEx.hInstance = g_hInst;
wndClassEx.hIcon = LoadIcon(NULL, IDI_APPLICATION);
wndClassEx.hCursor = LoadCursor(NULL, IDC_ARROW);
wndClassEx.hbrBackground = (HBRUSH) (COLOR_WINDOW);
wndClassEx.lpszMenuName = NULL;
wndClassEx.lpszClassName = szAppName;
wndClassEx.hIconSm = NULL;

RegisterClassEx(&wndClassEx);

g_hWnd = CreateWindowEx(0, szAppName, szAppName, WS_OVERLAPPED | WS_CAPTION | WS_SYSMENU | WS_THICKFRAME | WS_MINIMIZEBOX,
CW_USEDEFAULT, CW_USEDEFAULT, 300, 70,
NULL, NULL, g_hInst, NULL);

ShowWindow(g_hWnd, iCmdShow);
UpdateWindow(g_hWnd);

while (GetMessage(&msg, NULL, 0, 0))
{
TranslateMessage(&msg);
DispatchMessage(&msg);
}
return ((int) msg.wParam);
}
///////////////////////////////////////////////////////////////////

//////////////////////////////////////////////////////////////////
//主窗口回調函數
LRESULT CALLBACK WindowProc(HWND hWnd, UINT uMsg, WPARAM wParam, LPARAM lParam)
{
switch (uMsg)
{
case WM_CREATE:
CreateWindowEx(WS_EX_CLIENTEDGE, "EDIT", NULL, WS_CHILD | WS_VISIBLE | WS_BORDER | ES_AUTOHSCROLL | ES_AUTOVSCROLL | ES_NOHIDESEL | WS_OVERLAPPED,
7, 12, 220, 22,
hWnd, (HMENU)1000, g_hInst, NULL);
CreateWindowEx(0, "BUTTON", "&OK", WS_CHILD | WS_VISIBLE | BS_PUSHBUTTON | WS_OVERLAPPED | BS_FLAT,
244, 12, 40, 20,
hWnd, (HMENU)IDOK, g_hInst, NULL);

break;

case WM_COMMAND:
switch (LOWORD(wParam))
{
case IDOK:
GetDlgItemText(g_hWnd, 1000, szTemp + 100, 800);
wsprintf(szTemp, "當前文本框內的字符串的CRC32校驗碼是: 0x%lX", GetCRC32(szTemp + 100, (int)strlen(szTemp + 100)));
MessageBox(g_hWnd, szTemp, szAppName, MB_OK|MB_ICONINformATION);
}
break;

case WM_DESTROY:
PostQuitMessage(0);
break;

default:
return (DefWindowProc(hWnd, uMsg, wParam, lParam));
}
return (0);
}
/////////////////////////////////////////////////////////////////////

/////////////////////////////////////////////////////////////////////
//GetCRC32: 求字節流的CRC32校驗碼
//參數:
// pbData: 指向字節流緩衝區首地址
// nSize: 字節流長度
//
//返回值:
// 字節流的CRC32校驗碼
//
//這裏使用查表法求CRC32校驗碼,這部分是參考老羅的文章《 矛與盾的較量(2)——CRC原理篇》該寫的。
//原文的具體內容請參看: http://asp.7i24.com/netcool/laoluo/articles/show_article.asp?Article_ID=15
//
//下面使用內聯彙編求CRC32校驗碼,充分使用了CPU中的寄存器,速度和方便性都是使用C/C++所不能比擬的
//
DWORD GetCRC32(const BYTE *pbData, int nSize)
{
DWORD dwCRC32Table[256];

__asm //這片內聯彙編是初始化CRC32表
{
MOV ECX, 256

_NextTable:
LEA EAX, [ECX-1]
PUSH ECX
MOV ECX, 8

_NextBit:
SHR EAX, 1
JNC _NotCarry
XOR EAX, 0xEDB88320
_NotCarry:
DEC ECX
JNZ _NextBit

POP ECX
MOV [dwCRC32Table + ECX*4 - 4], EAX
DEC ECX
JNZ _NextTable
}

__asm //下面是求CRC32校驗碼
{
MOV EAX, -1
MOV EBX, pbData
OR EBX, EBX
JZ _Done
MOV ECX, nSize
OR ECX, ECX
JZ _Done

_NextByte:
MOV DL, [EBX]

XOR DL, AL
MOVZX EDX, DL
SHR EAX, 8
XOR EAX, [dwCRC32Table + EDX*4]

INC EBX
LOOP _NextByte
_Done:
NOT EAX
}
}

////////////////////////////////////////////////////////////////////////////


原文:http://hi.baidu.com/oumeida/blog/item/45bc60f0844a16a9a40f5299.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章