sizeof運算符的內存對齊問題

一、什麼是字節對齊

       計算機中內存空間都是按照byte劃分的,從理論上講似乎對任何類型的變量的訪問可以從任何地址開始,但實際情況是在訪問特定類型變量的時候經常在特定的內存地址訪問,這就需要各種類型數據按照一定的規則在空間上排列,而不是順序的一個接一個的排放,這就是對齊。

二、對齊的作用和原因:

      1、平臺原因(移植原因):不是所有的硬件平臺都能訪問任意地址上的任意數據的;某些硬件平臺只能在某些地址處取某些特定類型的數據,否則拋出硬件異常。各個硬件平臺對存儲空間的處理上有很大的不同。一些平臺對某些特定類型的數據只能從某些特定地址開始存取。比如有些架構的CPU在訪問一個沒有進行對齊的變量的時候會發生錯誤,那麼在這種架構下編程必須保證字節對齊。
      2、性能原因最常見的是如果不按照適合其平臺要求對數據存放進行對齊,會在存取效率上帶來損失。數據結構(尤其是棧)應該儘可能地在自然邊界上對齊。原因在於,爲了訪問未對齊的內存,處理器需要作兩次內存訪問,而對齊的內存訪問僅需要一次訪問。比如有些平臺每次讀都是從偶地址開始,如果一個int型(假設爲32位系統)如果存放在偶地址開始的地方,那麼一個讀週期就可以讀出這32bit,而如果存放在奇地址開始的地方,就需要2個讀週期,並對兩次讀出的結果的高低字節進行拼湊才能得到該32bit數據。顯然在讀取效率上下降很多。

三、對齊規則 

       每個特定平臺上的編譯器都有自己的默認“對齊係數”(也叫對齊模數)。程序員可以通過預編譯命令#pragma pack(n),n=1,2,4,8,16 來改變這一系數,其中的n就是你要指定的“對齊係數”。
規則:
1、
數據成員對齊規則:結構(struct)(或聯合(union))的數據成員,第一個數據成員放在offset爲0的地方,以後每個數據成員的對齊 按照#pragma pack指定的數值和這個數據成員自身長度中,比較小的那個進行。
2、結構(或聯合)的整體對齊規則:在數據成員完成各自對齊之後,結構(或聯合)本身也要進行對齊,對齊將按照#pragma pack指定的 數值和結構(或聯合)最大數據成員長度中,比較小的那個進行。
3、當#pragma pack的n值等於或超過所有數據成員長度的時候,這個n值的大小將不產生任何效果。

四、請看下面的結構:

struct MyStruct{
   double dda1;
   char dda;
   int type
};
       爲上面的結構分配空間的時候,VC根據成員變量出現的順序和對齊方式,先爲第一個成員dda1分配空間,其起始地址跟結構的起始地址相同(剛好偏移量0剛好爲sizeof(double)的倍數),該成員變量佔用sizeof(double)=8個字節;接下來爲第二個成員dda分配空間,這時下一個可以分配的地址對於結構的起始地址的偏移量爲8,是sizeof(char)的倍數,所以把dda存放在偏移量爲8的地方滿足對齊方式,該成員變量佔用 sizeof(char)=1個字節;接下來爲第三個成員type分配空間,這時下一個可以分配的地址對於結構的起始地址的偏移量爲9,不是sizeof (int)=4的倍數,爲了滿足對齊方式對偏移量的約束問題,VC自動填充3個字節(這三個字節沒有放什麼東西),這時下一個可以分配的地址對於結構的起始地址的偏移量爲12,剛好是sizeof(int)=4的倍數,所以把type存放在偏移量爲12的地方,該成員變量佔用sizeof(int)=4個字節;這時整個結構的成員變量已經都分配了空間,總的佔用的空間大小爲:8+1+(3)+4=16,剛好爲結構的字節邊界數(即結構中佔用最大空間的類型所佔用的字節sizeof(double)=8)的倍數,所以沒有空缺的字節需要填充。所以整個結構的大小爲:sizeof(MyStruct)=8+1+ (3)+4=16,其中有3個字節是VC自動填充的,沒有放任何有意義的東西。

下面再舉個例子,交換一下上面的MyStruct的成員變量的位置,使它變成下面的情況:

 struct MyStruct{
    char dda;
    double dda1;
    int type
};

這個結構佔用的空間爲多大呢?在VC6.0環境下,可以得到sizeof(MyStruc)爲24。結合上面提到的分配空間的一些原則,分析下VC怎麼樣爲上面的結構分配空間的。

struct MyStruct{
   char dda; 
   double dda1;
   int type;
};

所以該結構總的大小爲:sizeof(MyStruc)爲1+(7)+8+4+(4)=24。其中總的有7+4=11個字節是VC自動填充的,沒有放任何有意義的東西。

      VC對結構的存儲的特殊處理確實提高CPU存儲變量的速度,但是有時候也帶來了一些麻煩,我們也屏蔽掉變量默認的對齊方式,自己可以設定變量的對齊方式。VC 中提供了#pragma pack(n)來設定變量以n字節對齊方式。n字節對齊就是說變量存放的起始地址的偏移量有兩種情況:第一、如果n大於等於該變量所佔用的字節數,那麼偏移量必須滿足默認的對齊方式,第二、如果n小於該變量的類型所佔用的字節數,那麼偏移量爲n的倍數,不用滿足默認的對齊方式。結構的總大小也有個約束條件,分下面兩種情況:如果n大於所有成員變量類型所佔用的字節數,那麼結構的總大小必須爲佔用空間最大的變量佔用的空間數的倍數;否則必須爲n的倍數。

下面舉例說明其用法。

#pragma pack(push) 
#pragma pack(4)
struct test{ 
char m1;
double m4;
 int m3;
};
#pragma pack(pop)

       以上結構的大小爲16,下面分析其存儲情況,首先爲m1分配空間,其偏移量爲0,滿足我們自己設定的對齊方式(4字節對齊),m1佔用1個字節。接着開始爲 m4分配空間,這時其偏移量爲1,需要補足3個字節,這樣使偏移量滿足爲n=4的倍數(因爲sizeof(double)大於n),m4佔用8個字節。接着爲m3分配空間,這時其偏移量爲12,滿足爲4的倍數,m3佔用4個字節。這時已經爲所有成員變量分配了空間,共分配了16個字節,滿足爲n的倍數。如果把上面的#pragma pack(4)改爲#pragma pack(16),那麼我們可以得到結構的大小爲24。

五、再看下面這個例子

#pragma pack(8)
struct S1{
   char a;
   long b;
};
struct S2{ 
   char c;
   struct S1 d;
   long long e;
};
#pragma pack(pop)

       sizeof(S2)結果爲24.。成員對齊有一個重要的條件,即每個成員分別對齊。即每個成員按自己的方式對齊。也就是說上面雖然指定了按8字節對齊,但並不是所有的成員都是以8字節對齊。其對齊的規則是,每個成員按其類型的對齊參數(通常是這個類型的大小)和指定對齊參數(這裏是8字節)中較小的一個對齊。並且結構的長度必須爲所用過的所有對齊參數的整數倍,不夠就補空字節。

S1中,成員a是1字節默認按1字節對齊,指定對齊參數爲8,這兩個值中取1,a按1字節對齊;成員b是4個字節,默認是按4字節對齊,這時就按4字節對齊,所以sizeof(S1)應該爲8;
       S2 中,c和S1中的a一樣,按1字節對齊,而d 是個結構,它是8個字節,它按什麼對齊呢?對於結構來說,它的默認對齊方式就是它的所有成員使用的對齊參數中最大的一個,S1的就是4.所以,成員d就是按4字節對齊。成員e是8個字節,它是默認按8字節對齊,和指定的一樣,所以它對到8字節的邊界上,這時,已經使用了12個字節了,所以又添加了4個字節的空,從第16個字節開始放置成員e.這時,長度爲24,已經可以被8(成員e按8字節對齊)整除。這樣,一共使用了24個字節。
S1的內存佈局:11**,1111,
S2的內存佈局:1***,11**,1111,****11111111

這裏有三點很重要:
1.每個成員分別按自己的方式對齊,並能最小化長度。
2.複雜類型(如結構)的默認對齊方式是它最長的成員的對齊方式,這樣在成員是複雜類型時,可以最小化長度。
3.對齊後的長度必須是成員中最大的對齊參數的整數倍,這樣在處理數組時可以保證每一項都邊界對齊。

六、sizeof例子(注意:下面的例子都是經過測試驗證的)

<span style="font-size:14px;"><span style="font-family:SimSun;font-size:14px;">std::cout <<"void* size"<<sizeof(void*)<<std::endl; //4
std::cout <<"char size"<<sizeof(char)<<std::endl; //1
std::cout <<"unsigned char size"<<sizeof(unsigned char)<<std::endl; //1
std::cout <<"short size"<<sizeof(short)<<std::endl; //2
std::cout <<"int size"<<sizeof(int)<<std::endl;//4
std::cout <<"unsigned int size"<<sizeof(unsigned int)<<std::endl; //4
std::cout <<"long size"<<sizeof(long)<<std::endl; //4
std::cout <<"long int size"<<sizeof(long int)<<std::endl; //4
std::cout <<"long long size"<<sizeof(long long)<<std::endl; //8
std::cout <<"float size"<<sizeof(float)<<std::endl; //4
std::cout <<"double size"<<sizeof(double)<<std::endl; //8
std::cout <<"time_t size"<<sizeof(time_t)<<std::endl;//8
char bufc[32];
std::cout <<"bufc size"<<sizeof(bufc)<<std::endl;//32

struct teststruct{};
class testclass{};
std::cout <<"struct size"<<sizeof(teststruct)<<std::endl;//1
std::cout <<"class size"<<sizeof(testclass)<<std::endl;//1

class A
{
char c;
int val;
short sh;
};

class B
{
public:
char c;
int val;
short sh;
void func1(void){};
virtual void func2(void){};
};

std::cout <<"class size A"<<sizeof(A)<<std::endl;//12
std::cout <<"class size B"<<sizeof(B)<<std::endl;//16

char*p =NULL;
p=new char[100];
std::cout <<"size p"<<sizeof(p)<<std::endl;//4</span></span>

七、其它 

1、在編寫代碼時候可以通過#pragma pack(n),n=1,2,4,8,16來靈活控制內存對齊的係數,當需要關閉內存對齊時,可以使用#pragma pack()實現。
2、注意事項
內存對齊可以大大的提高編譯器的處理速度,但不是任何時候都是必需的,有的時候不注意的話,還可能出現意想不到的錯誤!最典 型的情況就是網絡通信程序的編碼中,一定要在定義結構體或者聯合之前使用#pragma pack()把內存對齊關閉,這是因爲遠程主機通 常不知道對方使用的何種對齊方式,通過socket接收的字節流,然後按照字節解析得到對應的結果,如果使用內存對齊,遠程主機很 可能會得到錯誤的結果!這種情況曾經指導上機時遇到過,而且屬於比較隱蔽的錯誤,debug了好久才發現問題出在這裏。
3、優化結構體
雖然內存對齊可以提高運行效率,但是卻浪費了內存,在現代PC上通常不會在乎這點小的空間,但是在一些內存很小的嵌入式設備上,可能就要錙銖必較了。其實我們發現在不影響功能的前提下,可以調整成員的順序來減少“內存空洞”帶來的浪費。



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章