C++中類的大小問題

以下的討論都是在不用#pragma pack( num )下的結果,num表示以多少個字節對齊。

初學者在學習面向對象的程序設計語言時,或多或少的都些疑問,我們寫的代碼與最終生編譯成的代碼卻 大相徑庭,我們並不知道編譯器在後臺做了什麼工作.這些都是由於我們僅停留在語言層的原因,所謂語言層就是教會我們一些基本的語法法則,但不會告訴我們爲什麼這麼做?今天和大家談的一點感悟就是我在學習編程過程中的一點經驗,是編譯器這方面的一個具體功能.

首先:我們要知道什麼是類的實例化,所謂類的實例化就是在內存中分配一塊地址.

那我們先看看一個例子:

#include<iostream.h>

class a {};
class b{};
class c:public a{
virtual void fun()=0;
};
class d:public b,public c{};
int main()
{
cout<<"sizeof(a)"<<sizeof(a)<<endl;
cout<<"sizeof(b)"<<sizeof(b)<<endl;
cout<<"sizeof(c)"<<sizeof(c)<<endl;
cout<<"sizeof(d)"<<sizeof(d)<<endl;
return 0;}

程序執行的輸出結果爲:

sizeof(a) =1

sizeof(b)=1

sizeof(c)=4

sizeof(d)=8 

上面是在VC++6.0編譯的結果,但是在Dev-C++和Code::Blocks下得出的結果是 sizeof( d ) = 4

爲什麼會出現這種結果呢?初學者肯定會很煩惱是嗎?類a,b明明是空類,它的大小應該爲爲0,爲什麼 編譯器輸出的結果爲1呢?這就是我們剛纔所說的實例化的原因(空類同樣可以被實例化),每個實例在內存中都有一個獨一無二的地址,爲了達到這個目的,編譯器往往會給一個空類隱含的加一個字節,這樣空類在實例化後在內存得到了獨一無二的地址.所以a,b的大小爲1.

而類c是由類a派生而來,它裏面有一個純虛函數,由於有虛函數的原因,有一個指向虛函數的指針(vptr),在32位的系統分配給指針的大小爲4個字節,所以最後得到c類的大小爲4.

類d的大小更讓初學者疑惑吧,類d是由類b,c派生邇來的,它的大小應該爲二者之和5,爲什麼卻是8  呢?這是因爲爲了提高實例在內存中的存取效率.類的大小往往被調整到系統的整數倍.並採取就近的法則,裏哪個最近的倍數,就是該類的大小,所以類d的大小爲8個字節.

當然在不同的編譯器上得到的結果可能不同,但是這個實驗告訴我們初學者,不管類是否爲空類,均可被實例化(空類也可被實例化),每個被實例都有一個獨一無二的地址.

我所用的編譯器爲vc++ 6.0.

下面我們再看一個例子.

#include<iostream.h>
class a{
pivate:
int data;
};

class b{
private:
     int data;
static int data1;
};
int b::data1=0;
void mian(){
cout<<"sizeof(a)="<<sizeof(a)<<endl;
cout<<"sizeof(b)="<<sizeof(b)<<endl;
}

執行結果爲:

sizeof(a)=4;

sizeof(b)=4;

爲什麼類b多了一個數據成員,卻大小和類a的大小相同呢?因爲:類b的靜態數據成員被編譯器放在程序的一個global data members中,它是類的一個數據成員.但是它不影響類的大小,不管這個類實際產生 了多少實例,還是派生了多少新的類,靜態成員數據在類中永遠只有一個實體存在,而類的非靜態數據成員只有被實例化的時候,他們才存在.但是類的靜態數據成員一旦被聲明,無論類是否被實例化,它都已存在.可以這麼說,類的靜態數據成員是一種特殊的全局變量.

所以a,b的大小相同.

下面我們看一個有構造函數,和析構函數的類的大小,它又是多大呢?

#include<iostream.h>
class A{
public :
A(int a){
   x=a;}
void f(int x){
   cout<<x<<endl;}
~A(){}

private:
   int x;
   int g;
   };
class B{
public:
private:
int data; int data2;
static int xs;
};
int B::xs=0;
void main(){
A s(10);
s.f(10);
cout<<"sozeof(a)"<<sizeof(A)<<endl;
cout<<"sizeof(b)"<<sizeof(B)<<endl;
}程序執行輸出結果爲:

10 ,

sizeof(a) 8

sizeof(b) 8

它們的結果均相同,可以看出類的大小與它當中的構造函數,析構函數,以及其他的成員函數無關,只與它當中的成員數據有關.

從以上的幾個例子不難發現類的大小:

1.爲類的非靜態成員數據的類型大小之和.

2.有編譯器額外加入的成員變量的大小,用來支持語言的某些特性(如:指向虛函數的指針).

3.爲了優化存取效率,進行的邊緣調整.

4 與類中的構造函數,析構函數以及其他的成員函數無關.

 

 

虛繼承之單繼承的內存佈局


 

C++2.0以後全面支持虛函數與虛繼承,這兩個特性的引入爲C++增強了不少功能,也引入了不少煩惱。虛函數與虛繼承有哪些特性,今天就不記錄了,如果能搞瞭解一下編譯器是如何實現虛函數和虛繼承,它們在類的內存空間中又是如何佈局的,卻可以對C++的瞭解深入不少。這段時間花了一些時間瞭解這些玩意,搞得偶都,不過總算有些收穫,嘿嘿。

先看一段代碼
class A
{
      virtual aa(){};
};

class B : public virtual  A
{
      char j[3];                                    //加入一個變量是爲了看清楚class中的vfptr放在什麼位置
      public:
            virtual bb(){};
};
class C : public virtual B
{
      char i[3];
      public:
            virtual cc(){};
};

這次先不給結果,先分析一下,也好加強一下印象。
1、對於class A,由於只有一個虛函數,那麼必須得有一個對應的虛函數表,來記錄對應的函數入口地址。同時在class A的內存空間中之需要有個vfptr_A指向該表。sizeof(A)也很容易確定,爲4。
2、對於class B,由於class B虛基礎了class A,同時還擁有自己的虛函數。那麼class B中首先擁有一個vfptr_B,指向自己的虛函數表。還有char j[3],做一次alignment,一般大小爲4。可虛繼承該如何實現咧?this is 啊 problem!偶之前是不曉得的,還好C++ Object Model上有介紹。首先要通過加入一個虛l類指針(記vbptr_B_A)來指向其父類,然後還要包含父類的所有內容。有些複雜了,不過還不難想象。sizeof(B)= 4+4+4+4=16(vfptr_B、char j[3]做alignment、vbptr_B_A和class A)。
3、在接着是class C了。class C首先也得有個vfptr_C,然後是char i[3],然後是vbptr_C_B,然後是class B,所以sizeof(C)=4+4+4+16=28(vfptr_C、char i[3]做alignment、vbptr_C_A和class B)。

在VC 6.0下寫了個程序,把上面幾個類的大小打印出來,果然結果爲4、16、28。hoho搞定!真的搞定了?也許經過上面的分析,雖然每個類具體的內存佈局還不大清楚,但其中的內容應該不會錯了。嘿嘿,在沒跟蹤時偶確實也是這麼想的,但結果卻是……

VC中虛繼承的內存佈局——單繼承
畫了個圖,簡單表示一下我跟蹤後的結果


虛基礎之單繼承時的內存佈局圖

class A的情況太簡單,沒問題。從class B的內存佈局圖可以得出下面的結論。
1、vf_ptr B放在了類的首部,那麼如果要想直接拿memcpy完成類的複製是很危險的,用struct也是不行的。改天再深入學習一下struct 和class的區別,可以看出這裏的差別來。
2、vbtbl_ptr_B,爲什麼不是先前我描述的vbptr_B_A呢?因爲這個指針與我先前猜測的內容有很大區別。這個指針指向的是class B的虛類表(嗯,俺自個兒起的名字,實在是學藝不精)。看看VB table,VB table有兩項,第一項爲FFFFFFFC,這一項的值可能沒啥意義,可能是爲了保證虛類表不爲空吧。第二項爲8,看起來像是class B中的class A相對該vbtbl_ptr_B的位移,也就是一個offset。類似的方法在C++ Object Model(P121)有介紹,可以去看看。
class C的內存佈局就比較複雜了,不過它的內存佈局也更一步說明我對vbtbl_ptr_B中的內容,也就是虛類表的理解是正確的。不過值得關注的是class B中的class A在佈局時被移到前面去了,雖然整個大小沒變,但這樣一來如果做這樣的操作  C c; B *b;b=&c;時b的操作如何呢?此時只要從c的虛類表裏獲得class B的位置既可賦值給b。但是在構建class C時會複雜一些,後面的使用還是非常簡單的,效率也比較高。class A的內存佈局被前移可能是考慮倒C的虛繼承順序吧

結論
1、VC在編譯時會把vfptr放到類的頭部;
2、VC採用虛表指針(vbtbl_ptr)來確定某個類所繼承的虛類。
3、VC會重新調整虛繼承的父類在子類中內存佈局。(具體規則還不清楚)
4、VC中虛類表中的第一項是無意義的,可能是爲了保證sizeof(虛類表)!=0;後面的內容爲父類在子類中相對該虛類表指針的偏移量。

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章