C++中extern “C”含義深層探索

  1.引言

  C++語言的創建初衷是“a better C”,不過這並不意味着C++中類似C語言的全局變量和函數所採用的編譯和連接方式和C語言完全相同。作爲一種欲和C兼容的語言,C++保留了一部分過程 式語言的特點(被世人稱爲“不完全地面向對象”),因而他能定義不屬於所有類的全局變量和函數。不過,C++畢竟是一種面向對象的程式設計語言,爲了支持 函數的重載,C++對全局函數的處理方式和C有明顯的不同。

  2.從標準頭文件說起

  某企業原來給出如下的一道面試題:

  面試題:爲什麼標準頭文件都有類似以下的結構?

  #ifndef __INCvxWorksh

  #define __INCvxWorksh

  #ifdef __cplusplus

  extern "C" {

  #endif

  /*...*/

  #ifdef __cplusplus

  }

  #endif

  #endif /* __INCvxWorksh */

  分析

  顯然,頭文件中的編譯宏“#ifndef __INCvxWorksh、#define __INCvxWorksh、#endif” 的作用是防止該頭文件被重複引用。

  那麼

  #ifdef __cplusplus

  extern "C" {

  #endif

  #ifdef __cplusplus

  }

  #endif

  的作用又是什麼呢?我們將在下文一一道來。

  3.深層揭密extern "C"

  extern "C" 包含雙重含義,從字面上即可得到:首先,被他修飾的目標是“extern”的;其次,被他修飾的目標是“C”的。讓我們來周詳解讀這兩重含義。

  被extern "C"限定的函數或變量是extern類型的;

  extern是C/C++語言中表明函數和全局變量作用範圍(可見性)的關鍵字,該關鍵字告訴編譯器,其聲明的函數和變量能在本模塊或其他模塊中使用。記住,下列語句:

  extern int a;

  僅僅是個變量的聲明,其並不是在定義變量a,並未爲a分配內存空間。變量a在所有模塊中作爲一種全局變量只能被定義一次,否則會出現連接錯誤。

  通常,在模塊的頭文件中對本模塊提供給其他模塊引用的函數和全局變量以關鍵字extern聲明。例如,如果模塊B欲引用該模塊A中定義的全局變 量和函數時只需包含模塊A的頭文件即可。這樣,模塊B中調用模塊A中的函數時,在編譯階段,模塊B雖然未找到該函數,不過並不會報錯;他會在連接階段中從 模塊A編譯生成的目標代碼中找到此函數。

  和extern對應的關鍵字是static,被他修飾的全局變量和函數只能在本模塊中使用。因此,一個函數或變量只可能被本模塊使用時,其不可能被extern “C”修飾。

  被extern "C"修飾的變量和函數是按照C語言方式編譯和連接的;

  未加extern “C”聲明時的編譯方式

  首先看看C++中對類似C的函數是怎樣編譯的。

  作爲一種面向對象的語言,C++支持函數重載,而過程式語言C則不支持。函數被C++編譯後在符號庫中的名字和C語言的不同。例如,假設某個函數的原型爲:

  void foo( int x, int y );

  該函數被C編譯器編譯後在符號庫中的名字爲_foo,而C++編譯器則會產生像_foo_int_int之類的名字(不同的編譯器可能生成的名字不同,不過都採用了相同的機制,生成的新名字稱爲“mangled name”)。

  foo_int_int 這樣的名字包含了函數名、函數參數數量及類型信息,C++就是靠這種機制來實現函數重載的。例如,在C++中,函數void foo( int x, int y )和void foo( int x, float y )編譯生成的符號是不相同的,後者爲_foo_int_float。

  同樣地,C++中的變量除支持局部變量外,還支持類成員變量和全局變量。用戶所編寫程式的類成員變量可能和全局變量同名,我們以"."來區分。 而本質上,編譯器在進行編譯時,和函數的處理相似,也爲類中的變量取了一個獨一無二的名字,這個名字和用戶程式中同名的全局變量名字不同。

  未加extern "C"聲明時的連接方式

  假設在C++中,模塊A的頭文件如下:

  // 模塊A頭文件 moduleA.h

  #ifndef MODULE_A_H

  #define MODULE_A_H

  int foo( int x, int y );

  #endif

  在模塊B中引用該函數:

  // 模塊B實現文件 moduleB.cpp

  #include "moduleA.h"

  foo(2,3);

  實際上,在連接階段,連接器會從模塊A生成的目標文件moduleA.obj中尋找_foo_int_int這樣的符號!

  加extern "C"聲明後的編譯和連接方式

  加extern "C"聲明後,模塊A的頭文件變爲:

  // 模塊A頭文件 moduleA.h

  #ifndef MODULE_A_H

  #define MODULE_A_H

  extern "C" int foo( int x, int y );

  #endif

  在模塊B的實現文件中仍然調用foo( 2,3 ),其結果是:

  (1)模塊A編譯生成foo的目標代碼時,沒有對其名字進行特別處理,採用了C語言的方式;

  (2)連接器在爲模塊B的目標代碼尋找foo(2,3)調用時,尋找的是未經修改的符號名_foo。

  如果在模塊A中函數聲明瞭foo爲extern "C"類型,而模塊B中包含的是extern int foo( int x, int y ) ,則模塊B未找到模塊A中的函數;反之亦然。

  所以,能用一句話概括extern “C”這個聲明的真實目的(所有語言中的所有語法特性的誕生都不是隨意而爲的,來源於真實世界的需求驅動。我們在思考問題時,不能只停留在這個語言是怎麼 做的,還要問一問他爲什麼要這麼做,動機是什麼,這樣我們能更深入地理解許多問題):

  實現C++和C及其他語言的混合編程。

  明白了C++中extern "C"的設立動機,我們下面來具體分析extern "C"通常的使用技巧。

  4.extern "C"的慣用法

  (1)在C++中引用C語言中的函數和變量,在包含C語言頭文件(假設爲cExample.h)時,需進行下列處理:

  extern "C"

  {

  #include "cExample.h"

  }

  而在C語言的頭文件中,對其外部函數只能指定爲extern類型,C語言中不支持extern "C"聲明,在.c文件中包含了extern "C"時會出現編譯語法錯誤。

  筆者編寫的C++引用C函數例子工程中包含的三個文件的原始碼如下:

  /* c語言頭文件:cExample.h */

  #ifndef C_EXAMPLE_H

  #define C_EXAMPLE_H

  extern int add(int x,int y);

  #endif

  /* c語言實現文件:cExample.c */

  #include "cExample.h"

  int add( int x, int y )

  {

  return x + y;

  }

  // c++實現文件,調用add:cppFile.cpp

  extern "C"

  {

  #include "cExample.h"

  }

  int main(int argc, char* argv[])

  {

  add(2,3);

  return 0;

  }

  如果C++調用一個C語言編寫的.DLL時,當包括.DLL的頭文件或聲明接口函數時,應加extern "C" { }。

  (2)在C中引用C++語言中的函數和變量時,C++的頭文件需添加extern "C",不過在C語言中不能直接引用聲明瞭extern "C"的該頭文件,應該僅將C文件中將C++中定義的extern "C"函數聲明爲extern類型。

  筆者編寫的C引用C++函數例子工程中包含的三個文件的原始碼如下:

  //C++頭文件 cppExample.h

  #ifndef CPP_EXAMPLE_H

  #define CPP_EXAMPLE_H

  extern "C" int add( int x, int y );

  #endif

  //C++實現文件 cppExample.cpp

  #include "cppExample.h"

  int add( int x, int y )

  {

  return x + y;

  }

  /* C實現文件 cFile.c

  /* 這樣會編譯出錯:#include "cExample.h" */

  extern int add( int x, int y );

  int main( int argc, char* argv[] )

  {

  add( 2, 3 );

  return 0;

  }

  如果深入理解了第3節中所闡述的extern "C"在編譯和連接階段發揮的作用,就能真正理解本節所闡述的從C++引用C函數和C引用C++函數的慣用法。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章