2018年02月02日 18:30:06 wenbin1996 閱讀數 3090更多
分類專欄: C++
概念
在C語言中,結構是一種複合數據類型,其構成元素既可以是基本數據類型(如int、long、float等)的變量,也可以是一些複合數據類型(如數組、結構、聯合等)的數據單元。在結構中,編譯器爲結構的每個成員按其自然邊界(alignment)分配空間。各個成員按照它們被聲明的順序在內存中順序存儲,第一個成員的地址和整個結構的地址相同。
爲了使CPU能夠對變量進行快速的訪問,變量的起始地址應該具有某些特性,即所謂的”對齊”,比如4字節的int型,其起始地址應該位於4字節的邊界上,即起始地址能夠被4整除,也即對齊跟數據在內存中的位置有關。如果一個變量的內存地址正好位於它長度的整數倍,他就被稱做自然對齊。
比如在32位cpu下,假設一個整型變量的地址爲0x00000004(爲4的倍數),那它就是自然對齊的,而如果其地址爲0x00000002(非4的倍數)則是非對齊的。
現代計算機中內存空間都是按照byte劃分的,從理論上講似乎對任何類型的變量的訪問可以從任何地址開始,但實際情況是在訪問特定類型變量的時候經常在特定的內存地址訪問,這就需要各種類型數據按照一定的規則在空間上排列,而不是順序的一個接一個的排放,這就是對齊。
爲什麼要字節對齊
需要字節對齊的根本原因在於CPU訪問數據的效率問題。假設上面整型變量的地址不是自然對齊,比如爲0x00000002,則CPU如果取它的值的話需要訪問兩次內存,第一次取從0x00000002-0x00000003的一個short,第二次取從0x00000004-0x00000005的一個short然後組合得到所要的數據,如果變量在0x00000003地址上的話則要訪問三次內存,第一次爲char,第二次爲short,第三次爲char,然後組合得到整型數據。
而如果變量在自然對齊位置上,則只要一次就可以取出數據。一些系統對對齊要求非常嚴格,比如sparc系統,如果取未對齊的數據會發生錯誤,而在x86上就不會出現錯誤,只是效率下降。
各個硬件平臺對存儲空間的處理上有很大的不同。一些平臺對某些特定類型的數據只能從某些特定地址開始存取。
比如有些架構的CPU在訪問一個沒有進行對齊的變量的時候會發生錯誤,那麼在這種架構下編程必須保證字節對齊,但其他平臺可能沒有這種情況,但是最常見的是如果不按照適合其平臺要求對數據存放進行對齊,會在存取效率上帶來損失。
比如有些平臺每次讀都是從偶地址開始,如果一個int型(假設爲32位系統)如果存放在偶地址開始的地方,那麼一個讀週期就可以讀出這32bit,而如果存放在奇地址開始的地方,就需要2個讀週期,並對兩次讀出的結果的高低字節進行拼湊才能得到該32bit數據。顯然在讀取效率上下降很多。
另外字節對齊的作用不僅是便於cpu快速訪問,同時合理的利用字節對齊可以==有效地節省存儲空間==。
也即CPU一次訪問時,要麼讀0x01~0x04,要麼讀0x05~0x08…硬件不支持一次訪問就讀到0x02~0x05
例:如果0x02~0x05存了一個int,讀取這個int就需要先讀0x01~0x04,留下0x02~0x04的內容,再讀0x05~0x08,留下0x05的內容,兩部分拼接起來才能得到那個int的值,這樣讀一個int就要兩次內存訪問,效率就低了。
針對字節對齊,我們在編程中如何考慮?
如果在編程的時候要考慮節約空間的話,那麼我們只需要假定結構的首地址是0,然後各個變量按照上面的原則進行排列即可,基本的原則就是把結構中的變量按照類型大小從小到大聲明,儘量減少中間的填補空間,還有一種就是爲了以空間換取時間的效率,我們顯示的進行填補空間進行對齊,比如:有一種使用空間換時間做法是顯式的插入reserved成員:
struct A{
char a;
char reserved[3]; //使用空間換時間
int b;
}
- 1
- 2
- 3
- 4
- 5
reserved成員對我們的程序沒有什麼意義,它只是起到填補空間以達到字節對齊的目的,當然即使不加這個成員通常編譯器也會給我們自動填補對齊,我們自己加上它只是起到顯式的提醒作用。
字節對齊可能帶來的隱患
代碼中關於對齊的隱患,很多是隱式的,比如在強制類型轉換的時候,例如:
unsigned int i = 0x12345678;
unsigned char *p = NULL;
unsigned short *p1 = NULL;
p = &i; //這裏可假設p指向了一個4的整數倍地址,例如0x04
*p = 0x00;
p1 = (unsigned short *)(p + 1); //這裏p1指向了p後移一位,也即爲0x05
*p1 = 0x0000;
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
這樣最後兩句代碼,從奇數邊界去訪問unsigned short型變量,顯然不符合對齊的規定,在x86上,類似的操作只會影響效率,但是在MIPS或者sparc上,可能就是一個error,因爲它們要求必須字節對齊.