C/C++中的struct 深層探索

聲明: 原文作者爲宋寶華,出處不詳。現整理出來,內容有增刪,僅供學習參考!    

1.   struct 的巨大作用     

面對一個人的大型C/C++程序時,只看其對struct的使用情況我們就可以對其編寫者的編程經驗進行評估。因爲一個大型的C/C++程序,勢必要涉及一些(甚至大量)進行數據組合的結構體,這些結構體可以將原本意義屬於一個整體的數據組合在一起。從某種程度上來說,會不會用struct,怎樣用struct是區別一個開發人員是否具備豐富開發經歷的標誌。      

在網絡協議、通信控制、嵌入式系統的C/C++編程中,我們經常要傳送的不是簡單的字節流(char型數組),而是多種數據組合起來的一個整體,其表現形式是一個結構體。       

經驗不足的開發人員往往將所有需要傳送的內容依順序保存在char型數組中,通過指針偏移的方法傳送網絡報文等信息。這樣做編程複雜,易出錯,而且一旦控制方式及通信協議有所變化,程序就要進行非常細緻的修改。   

    一個有經驗的開發者則靈活運用結構體,舉一個例子,假設網絡或控制協議中需要傳送三種報 文,其格式分別爲packetA、packetB、packetC:   

   struct structA   
   {   
    int a;   
    char b;   
   };   


   struct structB   
   {   
    char a;   
    short b;   
   };   


   struct structC   
   {   
    int a;   
    char b;   
    float c;   
   }   

    優秀的程序設計者這樣設計傳送的報文: 

     struct CommuPacket   
   {   
    int iPacketType;    //報文類型標誌   
    union            //每次傳送的是三種報文中的一種,使用union   
    {   
        struct structA packetA; struct structB packetB;   
        struct structC packetC;   
    }   
   };   

    在進行報文傳送時,直接傳送struct CommuPacket一個整體。   
    假設發送函數的原形如下:   
    // pSendData:發送字節流的首地址,iLen:要發送的長度   
   Send(char * pSendData, unsigned int  iLen);   

    發送方可以直接進行如下調用發送struct CommuPacket的一個實例sendCommuPacket:   

   Send( (char *)&sendCommuPacket , sizeof(CommuPacket) );   

    假設接收函數的原形如下:   

   // pRecvData:發送字節流的首地址,iLen:要接收的長度   
   //返回值:實際接收到的字節數   
   unsigned int Recv(char * pRecvData, unsigned int  iLen); 
  
    接收方可以直接進行如下調用將接收到的數據保存在 struct CommuPacket 的一個實recvCommuPacket 中:   

   Recv( (char *)&recvCommuPacket , sizeof(CommuPacket) );   


    接着判斷報文類型進行相應處理:   
   switch(recvCommuPacket. iPacketType)   
   {   
   case PACKET_A:   
   …    //A 類報文處理   
   break;   
   case PACKET_B:   
   …    //B 類報文處理   
   break;   
   case PACKET_C:   
   …   //C 類報文處理   
   break;   
   }   

    以上程序中最值得注意的是   
    Send( (char *)&sendCommuPacket , sizeof(CommuPacket) );   
   Recv( (char *)&recvCommuPacket , sizeof(CommuPacket) );   

    中的強制類型轉換:(char *)&sendCommuPacket、(char *)&recvCommuPacket,先取地址,再轉化爲 char 型指針,這樣就可以直接利用處理字節流的函數。   
    利用這種強制類型轉化,我們還可以方便程序的編寫,例如要對 sendCommuPacket所處內存初始化爲 0,可以這樣調用標準庫函數 memset():     
    memset((char *)&sendCommuPacket,0, sizeof(CommuPacket));   

2. struct的成員對齊   


   Intel、微軟等公司曾經出過一道類似的面試題:   
   #include <iostream.h>   
   #pragma pack(8)   
   struct example1   
    {  
     short a;   
      long b;   
    };   
    struct example2   
     {   
        char c;   
        example1 struct1;   
        short e;      
    };   
    #pragma pack()   
    int main(int argc, char* argv[])   
     {   
      example2 struct2;   
      cout << sizeof(example1) << endl;   
      cout << sizeof(example2) << endl;   
      cout << (unsigned int)(&struct2.struct1) - (unsigned int)(&struct2) << endl;   
      return 0;   
    }   
    問程序的輸入結果是什麼?   
    答案是:   
    8   
    16   
    4   
    不明白?還是不明白?下面一一道來:   

2.1 自然對界   

     struct 是一種複合數據類型,其構成元素既可以是基本數據類型(如 int、long、float 等)的變量,也可以是 一些複合數據類型(如 array、struct、union 等)的數據單元。對於結構體,編譯器會自動進行成員變量的對齊,以提高運算效率。缺省情況下,編譯器爲結構體的每個成員按其自然對界(natural alignment)條件分配空間。各個成員按照它們被聲明的順序在內存中順序存儲,第一個成員的地址和整個結構的地址相同。  

 

    自然對界(natural alignment)即默認對齊方式,是指按結構體的成員中 size 最大的成員對齊。   

     例如:   

    struct naturalalign   
     {   
        char a;   
        short b;   
        char c;   
    };   

    在上述結構體中,size最大的是 short,其長度爲 2 字節,因而結構體中的 char 成員 a、c 都以2 爲單位對齊,sizeof(naturalalign)的結果等於 6;  

 

    如果改爲:   
    struct naturalalign 
    {   
       char a;   
       int b;    
       char c;   
    };   
    其結果顯然爲 12。   

2.2 指定對界  


    一般地,可以通過下面的方法來改變缺省的對界條件:   
    · 使用僞指令#pragma pack (n),編譯器將按照 n個字節對齊;   
      · 使用僞指令#pragma pack (),取消自定義字節對齊方式。   
    注意:如果#pragma pack (n)中指定的 n 大於結構體中最大成員的 size,則其不起作用,結構體仍然按照 size 最大的成員進行對界。   

    例如:   

     #pragma pack (n)   
     struct naturalalign   
     {   
       char a;   
       int b;   
       char c;   
     };   
     #pragma pack ()   

當n爲4、8、16時,其對齊方式均一樣,sizeof(naturalalign)的結果都等於12。而當n爲2時,其發揮了作用,使得sizeof(naturalalign)的結果爲6。

另外,通過__attribute((aligned (n)))也可以讓所作用的結構體成員對齊在n字節邊界上,但是它較少被使用,因而不作詳細講解。  

2.3  面試題的解答   

    至此,我們可以對Intel、微軟的面試題進行全面的解答。   

    程序中第2行#pragma pack (8)雖然指定了對界爲8,但是由於struct example1中的成員最大size爲4(long變量size爲4),故struct example1仍然按4字節對界,struct example1的size爲8,即第18行的輸出結果;

struct example2中包含了struct example1,其本身包含的簡單數據成員的最大size爲2(short 變量e),但是因爲其包含了struct example1,而struct example1中的最大成員size爲4,struct  example2也應以4對界,#pragma pack (8)中指定的對界對struct example2也不起作用,故19行的輸出結果爲16;   

    由於struct example2中的成員以4爲單位對界,故其char變量c後應補充3個空,其後纔是成員struct1的內存空間,20行的輸出結果爲4。   

3. C 和 C++間 struct 的深層區別   

    在C++語言中struct具有了“類”  的功能,其與關鍵字class的區別在於struct中成員變量和函數的默認訪問權限爲public,而class的爲private。   
    例如,定義struct類和class類:   
    struct structA   
    {   
     char a;   
     …   
    }   
    class classB   
    {   
     char a;   
     …   
    }   
    則:   
    structA a;   
    a.a = 'a';    //訪問public成員,合法   
    classB b;   
    b.a = 'a';    //訪問private成員,不合法   

    許多文獻寫到這裏就認爲已經給出了C++中struct和class的全部區別,實則不然,另外一點需要注意的是:   
    C++中的struct保持了對C中struct的全面兼容(這符合C++的初衷——“a better c”), 因而,下面的操作是合法的:   
     //定義struct   
     struct structA   
     {   
     char a;   
     char b;   
     int c;   
     };   
     structA a = {'a' , 'a' ,1};    //  定義時直接賦初值   

      即struct可以在定義的時候直接以{ }對其成員變量賦初值,而class則不能,在經典書目《thinking C++ 2nd edition》中作者對此點進行了強調。   

4. struct 編程注意事項       

看看下面的程序:   

     1. #include <iostream.h>   
     2. struct structA   
     3. {   
     4.    int iMember;   
     5.    char *cMember;   
     6. };   
     7. int main(int argc, char* argv[])   
     8.{   
     9.    structA instant1,instant2;   
     10.   char c = 'a';       
     11.   instant1.iMember = 1;   
     12.   instant1.cMember = &c;     
     13.   instant2 = instant1;        
     14.   cout << *(instant1.cMember) << endl;     
     15.   *(instant2.cMember) = 'b';     
     16.   cout << *(instant1.cMember) << endl;     
     17.   return 0;   
       }   

      14行的輸出結果是:a   
      16行的輸出結果是:b   
      Why?我們在15行對instant2的修改改變了instant1中成員的值!   
      原因在於13行的instant2 = instant1賦值語句採用的是變量逐個拷貝,這使得instant1和 instant2中的cMember指向了同一片內存,因而對instant2的修改也是對instant1的修改。   
    在 C 語言中,當結構體中存在指針型成員時,一定要注意在採用賦值語句時是否將 2 個實例中的 指針型成員指向了同一片內存。   
    在C++語言中,當結構體中存在指針型成員時,我們需要重寫struct的拷貝構造函數並進行“=” 操作符重載。 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章