C語言中的構造數據類型有三種:數組、結構體和共用體。
數組是相同類型的元素的集合,只要會計算單個元素的大小,整個數組所佔空間等於基礎元素大小乘上元素的個數。結構體中的成員可以是不同的數據類型,成員按照定義時的順序依次存儲在連續的內存空間。和數組不一樣的是,結構體的大小不是所有成員大小簡單的相加,需要考慮到系統在存儲結構體變量時的地址對齊問題。看下面這樣的一個結構體:
- struct stu1
- {
- int i;
- char c;
- int j;
- };
用sizeof求該結構體的大小,發現值爲12。int佔4個字節,char佔1個字節,結果應該是9個字節纔對啊,爲什麼呢?
先介紹一個相關的概念——偏移量。偏移量指的是結構體變量中成員的地址和結構體變量地址的差。結構體大小等於最後一個成員的偏移量加上最後一個成員的大小。顯然,結構體變量中第一個成員的地址就是結構體變量的首地址。因此,第一個成員i的偏移量爲0。第二個成員c的偏移量是第一個成員的偏移量加上第一個成員的大小(0+4),其值爲4;第三個成員j的偏移量是第二個成員的偏移量加上第二個成員的大小(4+1),其值爲5。
然而,在實際中,存儲變量時地址要求對齊,編譯器在編譯程序時會遵循兩條原則:
(1)結構體變量中成員的偏移量必須是成員大小的整數倍(0被認爲是任何數的整數倍)
(2)結構體大小必須是所有成員大小的整數倍,也即所有成員大小的公倍數。
上面的例子中前兩個成員的偏移量都滿足要求,但第三個成員的偏移量爲5,並不是自身(int)大小的整數倍。編譯器在處理時會在第二個成員後面補上3個空字節,使得第三個成員的偏移量變成8。結構體大小等於最後一個成員的偏移量加上其大小,上面的例子中計算出來的大小爲12,滿足要求。再來看另外一個例子:
- struct stu2
- {
- int k;
- short t;
- };
由此可見,結構體類型需要考慮到字節對齊的情況,不同的順序會影響結構體的大小。
對比下面兩種定義順序:
- struct stu3
- {
- char c1;
- int i;
- char c2;
- }
- struct stu4
- {
- char c1;
- char c2;
- int i;
- }
對於嵌套的結構體,需要將其展開。對結構體求sizeof時,上述兩種原則變爲:
(1)展開後的結構體的第一個成員的偏移量應當是被展開的結構體中最大的成員的整數倍。
(2)結構體大小必須是所有成員大小的整數倍,這裏所有成員計算的是展開後的成員,而不是將嵌套的結構體當做一個整體。
看下面的例子:
- struct stu5
- {
- short i;
- struct
- {
- char c;
- int j;
- } ss;
- int k;
- }
結構體stu5的成員ss.c的偏移量應該是4,而不是2。整個結構體大小應該是16。
下述代碼測試原則2:
- struct stu5
- {
- char i;
- struct
- {
- char c;
- int j;
- } ss;
- char a;
- char b;
- char d;
- char e;
- char f;
- }
結構體ss單獨計算佔用空間爲8,而stu5的sizeof則是20,不是8的整數倍,這說明在計算sizeof(stu5)時,將嵌套的結構體ss展開了,這樣stu5中最大的成員爲ss.j,佔用4個字節,20爲4的整數倍。如果將ss當做一個整體,結果應該是24了。
另一個特殊的例子是結構體中包含數組,其sizeof應當和處理嵌套結構體一樣,將其展開,如下例子:
- struct ss
- {
- float f;
- char p;
- int adf[3];
- };
- cout<<sizeof(ss)<<endl;
其值爲20。float佔4個字節,到char p時偏移量爲4,p佔一個字節,到int adf[3]時偏移量爲5,擴展爲int的整數倍,而非int adf[3]的整數倍,這樣偏移量變爲8,而不是12。結果是8+12=20,是最大成員float或int的大小的整數倍。
如何給結構體變量分配空間由編譯器決定,以上情況針對的是Linux下的GCC。在Windows下的VC平臺也是這樣,至於其他平臺,可能會有不同的處理。