內存對齊問題

原創

2020-02-20 20:38

首先由一個程序引入話題：

1 //環境：vc6 + windows sp2
2 //程序1
3 #include <iostream>
4
5 using namespace std;
6
7 struct st1
8 {
9     char a ;
10     int  b ;
11     short c ;
12 };
13
14 struct st2
15 {
16     short c ;
17     char  a ;
18     int   b ;
19 };
20
21 int main()
22 {
23     cout<<"sizeof(st1) is "<<sizeof(st1)<<endl;
24     cout<<"sizeof(st2) is "<<sizeof(st2)<<endl;
25     return 0 ;
26 }
27

程序的輸出結果爲：

sizeof(st1) is 12

sizeof(st2) is 8

問題出來了，這兩個一樣的結構體，爲什麼sizeof的時候大小不一樣呢？

本文的主要目的就是解釋明白這一問題。

內存對齊，正是因爲內存對齊的影響，導致結果不同。

對於大多數的程序員來說，內存對齊基本上是透明的，這是編譯器該乾的活，編譯器爲程序中的每個數據單元安排在合適的位置上，從而導致了相同的變量，不同聲明順序的結構體大小的不同。

那麼編譯器爲什麼要進行內存對齊呢？程序1中結構體按常理來理解sizeof(st1)和sizeof(st2)結果都應該是7，4(int) + 2(short) + 1(char) = 7 。經過內存對齊後，結構體的空間反而增大了。

在解釋內存對齊的作用前，先來看下內存對齊的規則：

每個特定平臺上的編譯器都有自己的默認“對齊係數”(也叫對齊模數)。程序員可以通過預編

譯命令#pragma pack(n)，n=1,2,4,8,16 來改變這一系數，其中的n 就是你要指定的“對齊係數”。VC6默認8字節對齊

規則1：

數據成員對齊規則：結構(struct)(或聯合(union))的數據成員，第一個數據成員放在offset

爲0 的地方，以後每個數據成員的對齊按照#pragma pack 指定的數值和這個數據成員自身長度中，比較小的那個進行。

min( #pragma pack()指定的數，這個數據成員的自身長度 )

規則2：

結構(或聯合)的整體對齊規則：在數據成員完成各自對齊之後，結構(或聯合)本身也要進

行對齊，對齊將按照#pragma pack 指定的數值和結構(或聯合)最大數據成員長度中，比較小的那個進行。

min(#pragma pack()指定的數，結構（或聯合）最大數據成員長度）。結構總大小必須爲它的倍數

規則3：

結合1、2 顆推斷：當#pragma pack 的n 值等於或超過所有數據成員長度的時候，這個n

值的大小將不產生任何效果。

一個位域必須存儲在同一個字節中，不能跨兩個字節。

以程序1爲例解釋對齊的規則：

St1 ：char佔一個字節，起始偏移爲0 ，int 佔4個字節，min(#pragma pack()指定的數，這個數據成員的自身長度) = 4（VC6默認8字節對齊），所以int按4字節對齊，起始偏移必須爲4的倍數，所以起始偏移爲4，在char後編譯器會添加3個字節的額外字節，不存放任意數據。short佔2個字節，按2字節對齊，起始偏移爲8，正好是2的倍數，無須添加額外字節。到此規則1的數據成員對齊結束，此時的內存狀態爲：

oxxx|oooo|oo

0123 4567 89 （地址）

（x表示額外添加的字節）

共佔10個字節。還要繼續進行結構本身的對齊，對齊將按照#pragma pack指定的數值和結構(或聯合)最大數據成員長度中，比較小的那個進行，st1結構中最大數據成員長度爲int，佔4字節，而默認的#pragma pack 指定的值爲8，所以結果本身按照4字節對齊，結構總大小必須爲4的倍數，需添加2個額外字節使結構的總大小爲12 。此時的內存狀態爲：

oxxx|oooo|ooxx

0123 4567 89ab （地址）

到此內存對齊結束。St1佔用了12個字節而非7個字節。

St2 的對齊方法和st1相同，讀者可自己完成。

內存對齊的主要作用是：

平臺原因(移植原因)：不是所有的硬件平臺都能訪問任意地址上的任意數據的；某些硬件平臺只能在某些地址處取某些特定類型的數據，否則拋出硬件異常。

性能原因：經過內存對齊後，CPU的內存訪問速度大大提升。具體原因稍後解釋。

圖一：

這是普通程序員心目中的內存印象，由一個個的字節組成，而CPU並不是這麼看待的。

圖二：

CPU把內存當成是一塊一塊的，塊的大小可以是2，4，8，16字節大小，因此CPU在讀取內存時是一塊一塊進行讀取的。塊大小成爲memory access granularity（粒度） 本人把它翻譯爲“內存讀取粒度” 。

(32位操作系統內存地址應該是以4爲增量，程序中int佔4字節只能說他充分利用了這4字節，而bool型剩下的高位3字節應該是不使用的,待驗證）

假設CPU要讀取一個int型4字節大小的數據到寄存器中，分兩種情況討論：

數據從0字節開始

數據從1字節開始

再次假設內存讀取粒度爲4。

圖三：

當該數據是從0字節開始時，很CPU只需讀取內存一次即可把這4字節的數據完全讀取到寄存器中。

當該數據是從1字節開始時，問題變的有些複雜，此時該int型數據不是位於內存讀取邊界上，這就是一類內存未對齊的數據。

圖四：

此時CPU先訪問一次內存，讀取0—3字節的數據進寄存器，並再次讀取4—5字節的數據進寄存器，接着把0字節和6，7，8字節的數據剔除，最後合併1，2，3，4字節的數據進寄存器。對一個內存未對齊的數據進行了這麼多額外的操作，大大降低了CPU性能。

這還屬於樂觀情況了，上文提到內存對齊的作用之一爲平臺的移植原因，因爲以上操作只有有部分CPU肯幹，其他一部分CPU遇到未對齊邊界就直接罷工了。

原文地址：http://blog.csdn.net/weiqubo/article/details/4648402

fenma3422

發佈了5 篇原創文章 · 獲贊 1 · 訪問量 3萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

內存對齊問題

規則1：

規則2：

規則3：

釘釘打卡速度慢

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Golang初學：獲取程序內存使用情況，std runtime

特化和偏特化

《連線》：PC雖將死計算已無處不在

工資最高的時候成本最低

VS2010 檢查內存泄露的方法

工資最高時成本最低、利潤最高解析

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結