【系統運維】關於內存對齊

一、什麼是字節對齊,爲什麼要對齊?
現代計算機中內存空間都是按照byte劃分的，從理論上講似乎對任何類型的變量的訪問可以從任何地址開始，但實際情況是在訪問特定類型變量的時候經常在特定的內存地址訪問，這就需要各種類型數據按照一定的規則在空間上排列，而不是順序的一個接一個的排放，這就是對齊。
對齊的作用和原因：各個硬件平臺對存儲空間的處理上有很大的不同。一些平臺對某些特定類型的數據只能從某些特定地址開始存取。比如有些架構的CPU在訪問一個沒有進行對齊的變量的時候會發生錯誤,那麼在這種架構下編程必須保證字節對齊.其他平臺可能沒有這種情況，但是最常見的是如果不按照適合其平臺要求對數據存放進行對齊，會在存取效率上帶來損失。比如有些平臺每次讀都是從偶地址開始，如果一個int型（假設爲32位系統）如果存放在偶地址開始的地方，那麼一個讀週期就可以讀出這32bit，而如果存放在奇地址開始的地方，就需要2個讀週期，並對兩次讀出的結果的高低字節進行拼湊才能得到該32bit數據。顯然在讀取效率上下降很多。

二、請看下面的結構：

struct MyStruct
{
double dda1;
char dda;
int type
};
對結構MyStruct採用sizeof會出現什麼結果呢？sizeof(MyStruct)爲多少呢？也許你會這樣求：
sizeof(MyStruct)=sizeof(double)+sizeof(char)+sizeof(int)=13
但是當在VC中測試上面結構的大小時，你會發現sizeof(MyStruct)爲16。你知道爲什麼在VC中會得出這樣一個結果嗎？
其實，這是VC對變量存儲的一個特殊處理。爲了提高CPU的存儲速度，VC對一些變量的起始地址做了“對齊”處理。在默認情況下，VC規定各成員變量存放的起始地址相對於結構的起始地址的偏移量必須爲該變量的類型所佔用的字節數的倍數。下面列出常用類型的對齊方式(vc6.0,32位系統)。
類型
對齊方式（變量存放的起始地址相對於結構的起始地址的偏移量）
Char
偏移量必須爲sizeof(char)即1的倍數
int
偏移量必須爲sizeof(int)即4的倍數
float
偏移量必須爲sizeof(float)即4的倍數
double
偏移量必須爲sizeof(double)即8的倍數
Short
偏移量必須爲sizeof(short)即2的倍數
各成員變量在存放的時候根據在結構中出現的順序依次申請空間，同時按照上面的對齊方式調整位置，空缺的字節VC會自動填充。同時VC爲了確保結構的大小爲結構的字節邊界數（即該結構中佔用最大空間的類型所佔用的字節數）的倍數，所以在爲最後一個成員變量申請空間後，還會根據需要自動填充空缺的字節。
下面用前面的例子來說明VC到底怎麼樣來存放結構的。
struct MyStruct
{
double dda1;
char dda;
int type
}；
爲上面的結構分配空間的時候，VC根據成員變量出現的順序和對齊方式，先爲第一個成員dda1分配空間，其起始地址跟結構的起始地址相同（剛好偏移量0剛好爲sizeof(double)的倍數），該成員變量佔用sizeof(double)=8個字節；接下來爲第二個成員dda分配空間，這時下一個可以分配的地址對於結構的起始地址的偏移量爲8，是sizeof(char)的倍數，所以把dda存放在偏移量爲8的地方滿足對齊方式，該成員變量佔用 sizeof(char)=1個字節；接下來爲第三個成員type分配空間，這時下一個可以分配的地址對於結構的起始地址的偏移量爲9，不是sizeof (int)=4的倍數，爲了滿足對齊方式對偏移量的約束問題，VC自動填充3個字節（這三個字節沒有放什麼東西），這時下一個可以分配的地址對於結構的起始地址的偏移量爲12，剛好是sizeof(int)=4的倍數，所以把type存放在偏移量爲12的地方，該成員變量佔用sizeof(int)=4個字節；這時整個結構的成員變量已經都分配了空間，總的佔用的空間大小爲：8+1+3+4=16，剛好爲結構的字節邊界數（即結構中佔用最大空間的類型所佔用的字節數sizeof(double)=8）的倍數，所以沒有空缺的字節需要填充。所以整個結構的大小爲：sizeof(MyStruct)=8+1+ 3+4=16，其中有3個字節是VC自動填充的，沒有放任何有意義的東西。
下面再舉個例子，交換一下上面的MyStruct的成員變量的位置，使它變成下面的情況：
struct MyStruct
{
char dda;
double dda1;
int type
}；
這個結構佔用的空間爲多大呢？在VC6.0環境下，可以得到sizeof(MyStruc)爲24。結合上面提到的分配空間的一些原則，分析下VC怎麼樣爲上面的結構分配空間的。（簡單說明）
struct MyStruct
{
char dda;      //偏移量爲0，滿足對齊方式，dda佔用1個字節；
double dda1;//下一個可用的地址的偏移量爲1，不是sizeof(double)=8
                    //的倍數，需要補足7個字節才能使偏移量變爲8（滿足對齊
                   //方式），因此VC自動填充7個字節，dda1存放在偏移量爲8
                  //的地址上，它佔用8個字節。
int type；    //下一個可用的地址的偏移量爲16，是sizeof(int)=4的倍
           //數，滿足int的對齊方式，所以不需要VC自動填充，type存
           //放在偏移量爲16的地址上，它佔用4個字節。
}；//所有成員變量都分配了空間，空間總的大小爲1+7+8+4=20，不是結構
   //的節邊界數（即結構中佔用最大空間的類型所佔用的字節數sizeof
   //(double)=8）的倍數，所以需要填充4個字節，以滿足結構的大小爲
   //sizeof(double)=8的倍數。
所以該結構總的大小爲：sizeof(MyStruc)爲1+7+8+4+4=24。其中總的有7+4=11個字節是VC自動填充的，沒有放任何有意義的東西。
VC對結構的存儲的特殊處理確實提高CPU存儲變量的速度，但是有時候也帶來了一些麻煩，我們也屏蔽掉變量默認的對齊方式，自己可以設定變量的對齊方式。
VC 中提供了#pragma pack(n)來設定變量以n字節對齊方式。n字節對齊就是說變量存放的起始地址的偏移量有兩種情況：第一、如果n大於等於該變量所佔用的字節數，那麼偏移量必須滿足默認的對齊方式，第二、如果n小於該變量的類型所佔用的字節數，那麼偏移量爲n的倍數，不用滿足默認的對齊方式。結構的總大小也有個約束條件，分下面兩種情況：如果n大於所有成員變量類型所佔用的字節數，那麼結構的總大小必須爲佔用空間最大的變量佔用的空間數的倍數；
否則必須爲n的倍數。下面舉例說明其用法。
#pragma pack(push) //保存對齊狀態
#pragma pack(4)//設定爲4字節對齊
struct test
{
char m1;
double m4;
int m3;
};
#pragma pack(pop)//恢復對齊狀態
以上結構的大小爲16，下面分析其存儲情況，首先爲m1分配空間，其偏移量爲0，滿足我們自己設定的對齊方式（4字節對齊），m1佔用1個字節。接着開始爲 m4分配空間，這時其偏移量爲1，需要補足3個字節，這樣使偏移量滿足爲n=4的倍數（因爲sizeof(double)大於n）,m4佔用8個字節。接着爲m3分配空間，這時其偏移量爲12，滿足爲4的倍數，m3佔用4個字節。這時已經爲所有成員變量分配了空間，共分配了16個字節，滿足爲n的倍數。如果把上面的#pragma pack(4)改爲#pragma pack(16)，那麼我們可以得到結構的大小爲24。（請讀者自己分析）

三、再看下面這個例子

#pragma pack(8)
struct S1{
char a;
long b;
};
struct S2 {
char c;
struct S1 d;
long long e;
};
#pragma pack()
sizeof(S2)結果爲24.
成員對齊有一個重要的條件,即每個成員分別對齊.即每個成員按自己的方式對齊.
也就是說上面雖然指定了按8字節對齊,但並不是所有的成員都是以8字節對齊.其對齊的規則是,每個成員按其類型的對齊參數(通常是這個類型的大小)和指定對齊參數(這裏是8字節)中較小的一個對齊.並且結構的長度必須爲所用過的所有對齊參數的整數倍,不夠就補空字節.
S1中,成員a是1字節默認按1字節對齊,指定對齊參數爲8,這兩個值中取1,a按1字節對齊;成員b是4個字節,默認是按4字節對齊,這時就按4字節對齊,所以sizeof(S1)應該爲8;
S2 中,c和S1中的a一樣,按1字節對齊,而d 是個結構,它是8個字節,它按什麼對齊呢?對於結構來說,它的默認對齊方式就是它的所有成員使用的對齊參數中最大的一個,S1的就是4.所以,成員d就是按4字節對齊.成員e是8個字節,它是默認按8字節對齊,和指定的一樣,所以它對到8字節的邊界上,這時,已經使用了12個字節了,所以又添加了4個字節的空,從第16個字節開始放置成員e.這時,長度爲24,已經可以被8(成員e按8字節對齊)整除.這樣,一共使用了24個字節.
a b
S1的內存佈局：11**,1111,
c S1.a S1.b d
S2的內存佈局：1***,11**,1111,****11111111

這裏有三點很重要:
1.每個成員分別按自己的方式對齊,並能最小化長度。
2.複雜類型(如結構)的默認對齊方式是它最長的成員的對齊方式,這樣在成員是複雜類型時,可以最小化長度。
3.對齊後的長度必須是成員中最大的對齊參數的整數倍,這樣在處理數組時可以保證每一項都邊界對齊。

Win32平臺下的微軟編譯器(cl.exe for 80×86)的對齊策略：
1) 結構體變量的首地址能夠被其最寬基本類型成員的大小所整除；
備註：編譯器在給結構體開闢空間時，首先找到結構體中最寬的基本數據類型，然後尋找內存地址能被該基本數據類型所整除的位置，作爲結構體的首地址。將這個最寬的基本數據類型的大小作爲上面介紹的對齊模數。
2) 結構體每個成員相對於結構體首地址的偏移量（offset）都是成員大小的整數倍，如有需要編譯器會在成員之間加上填充字節（internal adding）；
備註:爲結構體的一個成員開闢空間之前，編譯器首先檢查預開闢空間的首地址相對於結構體首地址的偏移是否是本成員的整數倍，若是，則存放本成員，反之，則在本成員和上一個成員之間填充一定的字節，以達到整數倍的要求，也就是將預開闢空間的首地址後移幾個字節。
3) 結構體的總大小爲結構體最寬基本類型成員大小的整數倍，如有需要，編譯器會在最末一個成員之後加上填充字節（trailing padding）。
備註：結構體總大小是包括填充字節，最後一個成員滿足上面兩條以外，還必須滿足第三條，否則就必須在最後填充幾個字節以達到本條要求。

【系統運維】關於內存對齊

35K*14 薪，入職了！這公司只要不裁員，我能一直呆下去！

【項目管理】SVN服務器的搭建

【編程語言】SGI STL中的hash_map淺析

【性能分析】初探VS2010中的Profile（性能剖析）功能

【編程語言】如何解決菱形繼承問題

【系統運維】關於內存對齊

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結