extern "C"

經常在cpp的代碼之中看到這樣的代碼: 

#ifdef __cplusplus 
extern "C" { 
#endif 

//一段代碼 

#ifdef __cplusplus 

#endif 

  這樣的代碼到底是什麼意思呢?首先,__cplusplus是cpp中的自定義宏,那麼定義了這個宏的話表示這是一段cpp的代碼,也就是說,上面的代碼的含義是:如果這是一段cpp的代碼,那麼加入extern "C"{和}處理其中的代碼。 

  要明白爲何使用extern "C",還得從cpp中對函數的重載處理開始說起。在c++中,爲了支持重載機制,在編譯生成的彙編碼中,要對函數的名字進行一些處理,加入比如函數的返回類型等等.而在C中,只是簡單的函數名字而已,不會加入其他的信息.也就是說:C++和C對產生的函數名字的處理是不一樣的. 

  比如下面的一段簡單的函數,我們看看加入和不加入extern "C"產生的彙編代碼都有哪些變化: 

int f(void) 

return 1; 

  在加入extern "C"的時候產生的彙編代碼是: 

.file "test.cxx" 
.text 
.align 2 
.globl _f 
.def _f; .scl 2; .type 32; .endef 
_f: 
pushl %ebp 
movl %esp, %ebp 
movl $1, %eax 
popl %ebp 
ret 

  但是不加入了extern "C"之後 

.file "test.cxx" 
.text 
.align 2 
.globl __Z1fv 
.def __Z1fv; .scl 2; .type 32; .endef 
__Z1fv: 
pushl %ebp 
movl %esp, %ebp 
movl $1, %eax 
popl %ebp 
ret 

  兩段彙編代碼同樣都是使用gcc -S命令產生的,所有的地方都是一樣的,唯獨是產生的函數名,一個是_f,一個是__Z1fv。 

  明白了加入與不加入extern "C"之後對函數名稱產生的影響,我們繼續我們的討論:爲什麼需要使用extern "C"呢?C++之父在設計C++之時,考慮到當時已經存在了大量的C代碼,爲了支持原來的C代碼和已經寫好C庫,需要在C++中儘可能的支持C,而extern "C"就是其中的一個策略。 

  試想這樣的情況:一個庫文件已經用C寫好了而且運行得很良好,這個時候我們需要使用這個庫文件,但是我們需要使用C++來寫這個新的代碼。如果這個代碼使用的是C++的方式鏈接這個C庫文件的話,那麼就會出現鏈接錯誤.我們來看一段代碼:首先,我們使用C的處理方式來寫一個函數,也就是說假設這個函數當時是用C寫成的: 

//f1.c 
void f1() 

return; 

  編譯命令是:gcc -c f1.c -o f1.o 產生了一個叫f1.o的庫文件。再寫一段代碼調用這個f1函數: 

// test.cxx 
//這個extern表示f1函數在別的地方定義,這樣可以通過 
//編譯,但是鏈接的時候還是需要 
//鏈接上原來的庫文件. 
extern void f1(); 

int main() 

f1(); 

return 0; 

  通過gcc -c test.cxx -o test.o 產生一個叫test.o的文件。然後,我們使用gcc test.o f1.o來鏈接兩個文件,可是出錯了,錯誤的提示是: test.o(.text + 0x1f):test.cxx: undefine reference to 'f1()' 
  也就是說,在編譯test.cxx的時候編譯器是使用C++的方式來處理f1()函數的,但是實際上鍊接的庫文件卻是用C的方式來處理函數的,所以就會出現鏈接過不去的錯誤:因爲鏈接器找不到函數。 

  因此,爲了在C++代碼中調用用C寫成的庫文件,就需要用extern "C"來告訴編譯器:這是一個用C寫成的庫文件,請用C的方式來鏈接它們。 

  回到上面的問題,如果要改正鏈接錯誤,我們需要這樣子改寫test.cxx: 

extern "C" void f1();  

int main() 

f1(); 

return 0; 

  重新編譯並且鏈接就可以過去了.

當然使用上頭文件也可以,不使用也沒關係 比如,現在我們有了一個C庫文件,它的頭文件是f.h,產生的lib文件是f.lib,那麼我們如果要在C++中使用這個庫文件,我們需要這樣寫: 

extern "C" 

#include "f.h" 
}


總結 
      C和C++對函數的處理方式是不同的.extern "C"是使C++能夠調用C寫作的庫文件的一個手段,如果要對編譯器提示使用C的方式來處理函數的話,那麼就要使用extern "C"來說明。



******************************************************************************************************************************************************************************8888

1.引言

C++語言的創建初衷是“a better C”,但是這並不意味着C++中類似C語言的全局變量和函數所採用的編譯和連接方式與C語言完全相同。作爲一種欲與C兼容的語言,C++保留了一部分過程式語言的特點(被世人稱爲“不徹底地面向對象”),因而它可以定義不屬於任何類的全局變量和函數。但是,C++畢竟是一種面向對象的程序設計語言,爲了支持函數的重載,C++對全局函數的處理方式與C有明顯的不同。

2.從標準頭文件說起

某企業曾經給出如下的一道面試題:

面試題

爲什麼標準頭文件都有類似以下的結構?

   #ifndef __INCvxWorksh

   #define __INCvxWorksh

   #ifdef __cplusplus

   extern "C" {

   #endif

   /*…*/

   #ifdef __cplusplus

   }

   #endif

   #endif /* __INCvxWorksh */

分析

顯然,頭文件中的編譯宏“#ifndef __INCvxWorksh#define__INCvxWorksh#endif 的作用是防止該頭文件被重複引用。

那麼

   #ifdef __cplusplus

   extern "C" {

   #endif

  #ifdef __cplusplus

   }

   #endif

的作用又是什麼呢?我們將在下文一一道來。

3.深層揭密extern "C"

extern "C" 包含雙重含義,從字面上即可得到:首先,被它修飾的目標是“extern”的;其次,被它修飾的目標是“C”的。讓我們來詳細解讀這兩重含義。

(1)       extern "C"限定的函數或變量是extern類型的;

externC/C++語言中表明函數和全局變量作用範圍(可見性)的關鍵字,該關鍵字告訴編譯器,其聲明的函數和變量可以在本模塊或其它模塊中使用。記住,下列語句:

extern int a;

僅僅是一個變量的聲明,其並不是在定義變量a,並未爲a分配內存空間。變量a在所有模塊中作爲一種全局變量只能被定義一次,否則會出現連接錯誤。

通常,在模塊的頭文件中對本模塊提供給其它模塊引用的函數和全局變量以關鍵字extern聲明。例如,如果模塊B欲引用該模塊A中定義的全局變量和函數時只需包含模塊A的頭文件即可。這樣,模塊B中調用模塊A中的函數時,在編譯階段,模塊B雖然找不到該函數,但是並不會報錯;它會在連接階段中從模塊A編譯生成的目標代碼中找到此函數。

extern對應的關鍵字是static,被它修飾的全局變量和函數只能在本模塊中使用。因此,一個函數或變量只可能被本模塊使用時,其不可能被extern “C”修飾。

(2)       extern "C"修飾的變量和函數是按照C語言方式編譯和連接的;

未加extern “C”聲明時的編譯方式

首先看看C++中對類似C的函數是怎樣編譯的。

作爲一種面向對象的語言,C++支持函數重載,而過程式語言C則不支持。函數被C++編譯後在符號庫中的名字與C語言的不同。例如,假設某個函數的原型爲:

void foo( int x, int y );

該函數被C編譯器編譯後在符號庫中的名字爲_foo,而C++編譯器則會產生像_foo_int_int之類的名字(不同的編譯器可能生成的名字不同,但是都採用了相同的機制,生成的新名字稱爲“mangled name”)。_foo_int_int這樣的名字包含了函數名、函數參數數量及類型信息,C++就是靠這種機制來實現函數重載的。例如,在C++中,函數void foo( int x, int y )void foo( int x, float y )編譯生成的符號是不相同的,後者爲_foo_int_float

同樣地,C++中的變量除支持局部變量外,還支持類成員變量和全局變量。用戶所編寫程序的類成員變量可能與全局變量同名,我們以"."來區分。而本質上,編譯器在進行編譯時,與函數的處理相似,也爲類中的變量取了一個獨一無二的名字,這個名字與用戶程序中同名的全局變量名字不同。

未加extern "C"聲明時的連接方式

假設在C++中,模塊A的頭文件如下:

// 模塊A頭文件 moduleA.h

#ifndef MODULE_A_H

       #define MODULE_A_H

    int foo( int x, int y );

#endif

在模塊B中引用該函數:

// 模塊B實現文件 moduleB.cpp

#include "moduleA.h"

foo(2,3);

實際上,在連接階段,連接器會從模塊A生成的目標文件moduleA.obj中尋找_foo_int_int這樣的符號!

extern "C"聲明後的編譯和連接方式

extern "C"聲明後,模塊A的頭文件變爲:

// 模塊A頭文件 moduleA.h

#ifndef MODULE_A_H

       #define MODULE_A_H

    extern "C" int foo( int x, int y );

#endif

在模塊B的實現文件中仍然調用foo( 2,3 ),其結果是:

1)模塊A編譯生成foo的目標代碼時,沒有對其名字進行特殊處理,採用了C語言的方式;

2)連接器在爲模塊B的目標代碼尋找foo(2,3)調用時,尋找的是未經修改的符號名_foo

如果在模塊A中函數聲明瞭fooextern "C"類型,而模塊B中包含的是extern int foo( int x, int y ) ,則模塊B找不到模塊A中的函數;反之亦然。

所以,可以用一句話概括extern “C”這個聲明的真實目的(任何語言中的任何語法特性的誕生都不是隨意而爲的,來源於真實世界的需求驅動。我們在思考問題時,不能只停留在這個語言是怎麼做的,還要問一問它爲什麼要這麼做,動機是什麼,這樣我們可以更深入地理解許多問題):

實現C++C及其它語言的混合編程。

明白了C++extern "C"的設立動機,我們下面來具體分析extern "C"通常的使用技巧。

4.extern "C"的慣用法

1)在C++中引用C語言中的函數和變量,在包含C語言頭文件(假設爲cExample.h)時,需進行下列處理:

extern "C"

{

#include "cExample.h"

}

而在C語言的頭文件中,對其外部函數只能指定爲extern類型,C語言中不支持extern "C"聲明,在.c文件中包含了extern "C"時會出現編譯語法錯誤。

筆者編寫的C++引用C函數例子工程中包含的三個文件的源代碼如下:

/* c語言頭文件:cExample.h */

#ifndef C_EXAMPLE_H

#define C_EXAMPLE_H

extern int add(int x,int y);

#endif

/* c語言實現文件:cExample.c */

#include "cExample.h"

int add( int x, int y )

{

       return x + y;

}

// c++實現文件,調用addcppFile.cpp

extern "C"

{

#include "cExample.h"

}

int main(int argc, char* argv[])

{

       add(2,3);

       return 0;

}

如果C++調用一個C語言編寫的.DLL時,當包括.DLL的頭文件或聲明接口函數時,應加extern "C" { }

2)在C中引用C++語言中的函數和變量時,C++的頭文件需添加extern "C",但是在C語言中不能直接引用聲明瞭extern "C"的該頭文件,應該僅將C文件中將C++中定義的extern "C"函數聲明爲extern類型。

筆者編寫的C引用C++函數例子工程中包含的三個文件的源代碼如下:

//C++頭文件 cppExample.h

#ifndef CPP_EXAMPLE_H

#define CPP_EXAMPLE_H

extern "C" int add( int x, int y );

#endif

//C++實現文件 cppExample.cpp

#include "cppExample.h"

int add( int x, int y )

{

       return x + y;

}

/* C實現文件 cFile.c

/* 這樣會編譯出錯:#include "cExample.h" */

extern int add( int x, int y );

int main( int argc, char* argv[] )

{

       add( 2, 3 );    

       return 0;

}

如果深入理解了第3節中所闡述的extern "C"在編譯和連接階段發揮的作用,就能真正理解本節所闡述的從C++引用C函數和C引用C++函數的慣用法。對第4節給出的示例代碼,需要特別留意各個細節。

Posted in 1.C/C++開發 | 5 Comments »

5 Responses to “C++中extern “C”含義深層探索”


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章