sizeof求結構體大小的問題
標籤(空格分隔):c/c++
具體見:http://www.cnblogs.com/0201zcr/p/4789332.html?utm_source=tuicool&utm_medium=referral
sizeof求解結構體大小的問題
如何給結構體變量分配空間由編譯器決定,下面的情況針對的是Linux下的GCC。在Windows下的VC平臺也是這樣,至於其他平臺,可能會有不同的處理。
C/C++中不同數據類型所佔用的內存大小(單位都是字節)
- 32位 64位 char 1 1 int 4 大多數4,少數8 short 2 2 long 4 8 float 4 4 double 8 8 指針 4 8 - 結構體(struct):比較複雜,對齊問題需要考慮清楚
- 聯合(union) :取聯合的所有成員中最長的作爲聯合的長度
- 枚舉(enum) :取決於數據類型
sizeof計算單層結構體大小
運算符sizeof可以計算出給定類型的大小,對於32位系統來說,sizeof(char) = 1; sizeof(int) = 4。基本數據類型的大小很好計算,我們來看一下如何計算構造數據類型的大小。
C語言中的構造數據類型有三種:數組、結構體和共用體。具體如下:數組
是相同類型的元素的集合,只要會計算單個元素的大小,整個數組所佔空間等於基礎元素大小乘上元素的個數。結構體
結構體中的成員可以是不同的數據類型,成員按照定義時的順序依次存儲在連續的內存空間。和數組不一樣的是,結構體的大小不是所有成員大小簡單的相加,需要考慮到系統在存儲結構體變量時的地址對齊問題。看下面這樣的一個結構體:struct stu1 { int i; char c; int j; };
用sizeof求該結構體的大小,發現值爲12。int佔4個字節,char佔1個字節,結果應該是9個字節纔對啊,爲什麼呢?
先介紹一個相關的概念——偏移量。偏移量指的是結構體變量中成員的地址和結構體變量地址的差。結構體大小等於最後一個成員的偏移量加上最後一個成員的大小。顯然,結構體變量中第一個成員的地址就是結構體變量的首地址。因此,第一個成員i的偏移量爲0。第二個成員c的偏移量是第一個成員的偏移量加上第一個成員的大小(0+4),其值爲4;第三個成員j的偏移量是第二個成員的偏移量加上第二個成員的大小(4+1),其值爲5。
然而,在實際中,存儲變量時地址要求對齊,編譯器在編譯程序時會遵循兩條原則:(1)結構體變量中成員的偏移量必須是成員大小的整數倍(0被認爲是任何數的整數倍)
(2)結構體大小必須是所有成員大小的整數倍,也即所有成員大小的公倍數。上面的例子中前兩個成員的偏移量都滿足要求,但第三個成員的偏移量爲5,並不是自身(int)大小的整數倍。編譯器在處理時會在第二個成員後面補上3個空字節,使得第三個成員的偏移量變成8。結構體大小等於最後一個成員的偏移量加上其大小,上面的例子中計算出來的大小爲12,滿足要求。
再來看另外一個例子:
struct stu2 { int k; short t; };
成員k的偏移量爲0;成員t的偏移量爲4,都不需要調整。但計算出來的大小爲6,顯然不是成員k大小的整數倍。因此,編譯器會在成員t後面補上2個字節,使得結構體的大小變成8從而滿足第二個要求。由此可見,結構體類型需要考慮到字節對齊的情況,不同的順序會影響結構體的大小。
sizeof計算嵌套的結構體大小
對於嵌套的結構體,需要將其展開。對結構體求sizeof時,上述兩種原則變爲:(1)展開後的結構體的第一個成員的偏移量應當是被展開的結構體中最大的成員的整數倍。
(2)結構體(最終的)大小必須是所有成員(任意成員)大小的整數倍,這裏所有成員計算的是展開後的成員,而不是將嵌套的結構體當做一個整體。
(3)被展開的結構體的規則同單結構體sizeof計算規則。看下面的例子:
struct stu5 { short i; struct { char c; int j; } ss; int k; }
結構體stu5的成員ss.c的偏移量應該是4,而不是2。整個結構體大小應該是16,即4+(4+4)+4,第二個4是
char c
的擴展。下面的代碼測試原則2:
struct stu5 { char i; struct { char c; int j; } ss; char a; char b; char d; char e; char f; }
結構體ss單獨計算佔用空間爲8,而stu5的sizeof則是20(由17擴展至20,而不是擴展到24),不是8的整數倍,這說明在計算sizeof(stu5)時,將嵌套的結構體ss展開了,這樣stu5中最大的成員爲ss.j,佔用4個字節,20爲4的整數倍。如果將ss當做一個整體,結果應該是24了。
另一個常見的例子:
結構體中包含數組,其sizeof應當和處理嵌套結構體一樣,將其展開
struct ss { float f; char p; int adf[3]; };
其值爲20。float佔4個字節,到char p時偏移量爲4,p佔一個字節,到int adf[3]時偏移量爲5,擴展爲int的整數倍,而非int adf[3]的整數倍,這樣偏移量變爲8,而不是12。結果是8+12=20,是最大成員float或int的大小的整數倍。
【補充】另外一個涉及數據類型以及內存存儲的問題
內存中的數據並非保存在任意地址。處理器通常按照和其字大小相同的塊讀取內存數據;那麼考慮到效率因素,編譯器會按照塊大小的整數倍對內存中的實體進行地址對齊。因此在 32 位的處理器上,一個 4 字節整型數據肯定存放在內存地址能被4整除的地方。
下面,假設系統中整型數據和指針大小均爲 4 字節。
現在有一個指向整型的指針。如上所述,整型數據可以存放在內存地址 0×1000 或者 0×1004 或者 0×1008,但是決不會存放在 0×1001 或者0×1002 或者 0×1003 或者其他不能被4整除的任何地址。所有是4整數倍的二進制數都是以 00 結尾。實際上,這意味着對於所有指向整型的指針,它的最後兩位總是 0。
因爲有這樣的情況發生,我們倒是可以利用
4整數倍的二進制數都是以00結尾
這樣的特性,將一些臨時數據存儲在地址的低兩位的位置,只是記得地址取數據的時候一定要恢復地址的原始值。相應的數據隱藏的處理可見:http://blog.jobbole.com/83213/?url_type=39&object_type=webpage&pos=1