談談C++中的數據對齊

對於C/C++程序員來說，掌握數據對齊是很有必要的，因爲只有瞭解了這個概念，才能知道編譯器在什麼時候會偷偷的塞入一些字節（padding）到我們的結構體（struct/class），也唯有這樣我們才能更好的理解、優化結構體和內存。

幾個栗子

看看幾個簡單的Struct，能猜出他們的SIZE嗎？（運行於64Bit win10 vs2017）

struct A
{
	char c1;
};

struct B
{
	int i1;
};

struct C
{
	char c1;
	int i1;
};

struct D
{
	char c1;
	int i1;
	char c2;
};

struct E
{
	char c1;
	char c2;
	int i1;
};

int main()
{
	std::cout << "A's size is " << sizeof(A) << std::endl;
	std::cout << "B's size is " << sizeof(B) << std::endl;
	std::cout << "C's size is " << sizeof(C) << std::endl;
	std::cout << "D's size is " << sizeof(D) << std::endl;
	std::cout << "E's size is " << sizeof(E) << std::endl;	
}

先揭曉答案

如果對任何一個結構體的大小有疑問，那麼這篇文章非常適合你，請接着往下看，我們會解釋數據對齊。

數據對齊

處理器讀取數據的行爲

在C/C++中，每種數據類型都有對齊的要求（這個更多是處理器的要求而非語言層面），大家都知道，處理器工作的時候需要數據總線（data bus）、控制總線（control bus）和地址總線（address bus）一起配合工作。而在數據總線取數據的時候，處理器爲了高效的工作，一次會取4byte或者8byte數據（依系統32bit或者64bit而不同），這就是所謂數據字長（word size）。同時在讀取內存的時候，也會從4byte或者8byte邊界開始讀取，這是處理器行爲，我們只能尊重不能改變。考慮下面的例子，

struct F
{
   int i1
   char c1;
   int i2;
   char c2;
};
#include <iostream>

int main()
{
   F f;
   printf("0x%p\n", &f);
}

它的起始地址輸出是：
0x000000FE8BCFFB88

所以在內存中可能的排列就是：

讀取數據的時候，每次讀入8btye，8個字節爲一個讀取單元，就像蒸籠的一格，這樣做的好處是每次可以儘可能多的讀入數據，減少讀取次數。設想，如果一次只讀入一個字節數據，那麼一個Int就需要4次讀取，明顯效率就很低。

編譯器的做法

如果沒有對齊

瞭解了處理器如何讀取數據的，我們就不難理解編譯器爲什麼會做出調整。試想，如果編譯器不在後臺做出填充（padding），那麼我們就會遇到這種情況

像這樣的話，訪問i1, c1 都不會有問題，但是訪問i2就會發現，數據散落在不同的蒸籠，原本只需要一次讀取就行的數據，還需要一次額外的數據讀取才行，這就造成了讀取數據的低效，在某些嚴格的CPU，比如ARM上面，這種非對齊的數據讀操作甚至會被拒絕。

編譯器對齊

所以，爲了讓數據讀取效率最大化，編譯器會選擇犧牲一部分空間來換取效率，他們不會允許i2橫跨兩個讀取單元。在實際中，上面的結構體會是這樣的

可以看出，

爲了解決i2的對齊問題，c1之後填充了3個空字節
同時爲了保持整個結構體的對齊（結構體對齊字節數等於其最大的數據成員的對齊字節數，這裏是4），在結構體的尾部還會有3個空字節
整個結構體的大小就是16字節，有6個字節是空字節。

所以，在編譯器的作用下，最開始幾個Struct實際上擴展爲，

struct A
{
	char c1; //no padding
};

struct B
{
	int i1; //no padding
};

struct C
{
	char c1;
	char pad[3]; //padding
	int i1;
};

struct D
{
	char c1;
	char pad1[3]; //padding
	int i1;
	char c2;
	char pad2[3]; //padding
};

struct E
{
	char c1;
	char c2;
	char pad[2]; //padding
	int i1;
};

對齊的目的是要讓數據訪問更高效，一般來說，數據類型的對齊要求和它的長度是一致的，比如，

char 是 1
short 是 2
int 是 4
double 是 8

這不是巧合，比如short，2對齊保證了short只可能出現在一個讀取單元的0, 2, 4, 6格，而不會出現在1, 3, 5, 7格；再比如int，4對齊保證了一個讀取單元可以裝載2個int——在0或者4格。從根本上杜絕了同一個數據橫跨讀取單元的問題。

總結

可能有人會疑惑了，知道這些對我們工作有什麼幫助嗎？如果僅僅是比較High-Level的應用程序編程，可能確實感覺不明顯，最多就當成一個知識點了解一下，但是對於搞比較底層開發的，比如遊戲引擎，或者是在內存環境很緊張的情況下開發，比如嵌入式開發，那瞭解這個有助於在某些情況下節約內存。
考慮前面的D和E結構體，他們擁有完全一樣的成員，卻有着不同的結構體大小，就是因爲E選擇把對齊要求接近的變量類型放在一起，減小了填充padding的數量從而達到了減小結構體大小的目的。
在設計結構體的時候，這個可以作爲一個考量，有一些函數可以幫助我們查看某個類型的對齊要求，比如Visual Studio中的__alignof函數。
這就是關於數據對齊的一些基礎知識，希望能幫助大家解惑，如果您發現本文有任何寫的不對的地方，歡迎留言指出來；如果有其他問題，也歡迎留言一起討論。

談談C++中的數據對齊

幾個栗子

數據對齊

處理器讀取數據的行爲

編譯器的做法

如果沒有對齊

編譯器對齊

總結

聊聊C#中的composite模式

聊聊C#中的Mixin

聊聊C#中的Visitor模式

C++中的間接宏函數

一個C++引用庫的頭文件預編譯陷阱

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結