漫談C語言結構體

轉自 開源電子論壇 原博主 shr5791



1. C語言中的結構體有何作用

2. 結構體成員變量內存對齊有何講究(重點)

對於一些概念的說明,我就不把C語言教材上的定義搬上來。我們坐下來慢慢聊吧。

==============================================================================================================================================
 

1. 結構體有何作用

三個月前,教研室裏一個學長在華爲南京研究院的面試中就遇到這個問題。當然,這只是面試中最基礎的問題。如果問你你怎麼回答?

我的理解是這樣的,C語言中結構體至少有以下三個作用:

 

(1)有機地組織了對象的屬性。

比如,在STM32RTC開發中,我們需要數據來表示日期和時間,這些數據通常是年、月、日、時、分、秒。如果我們不用結構體,那麼就需要定義6個變量來表示。這樣的話程序的數據結構是鬆散的,我們的數據結構最好是“高內聚,低耦合”的。所以,用一個結構體來表示更好,無論是從程序的可讀性還是可移植性還是可維護性皆是:

typedef struct   //公曆日期和時間結構體

{

    vu16  year;

    vu8   month;

    vu8   date;

    vu8   hour;

    vu8   min;

    vu8   sec;  

}_calendar_obj;  

 _calendar_obj calendar;  //定義結構體變量

 

(2)以修改結構體成員變量的方法代替了函數(入口參數)的重新定義。

如果說結構體有機地組織了對象的屬性表示結構體“中看”,那麼以修改結構體成員變量的方法代替函數(入口參數)的重新定義就表示了結構體“中用”。繼續以上面的結構體爲例子,我們來分析。假如現在我有如下函數來顯示日期和時間:


void DsipDateTime( _calendar_obj  DateTimeVal)

那麼我們只要將一個_calendar_obj這個結構體類型的變量作爲實參調用DsipDateTime()即可,DsipDateTime()通過DateTimeVal的成變量來實現內容的顯示。如果不用結構體,我們很可能需要寫這樣的一個函數:


void DsipDateTime( vu16 yearvu8 monthvu8 datevu8 hourvu8 minvu8 sec)

顯然這樣的形參很不可觀,數據結構管理起來也很繁瑣。如果某個函數的返回值得是一個表示日期和時間的數據,那就更復雜了。這只是一方面。

另一方面,如果用戶需要表示日期和時間的數據中還要包含星期(),這個時候,如果之前沒有用機構體,那麼應該在DsipDateTime()函數中在增加一個形參vu8 week

void DsipDateTime( vu16 yearvu8 monthvu8 datevu8 weekvu8 hourvu8 minvu8 sec)

可見這種方法來傳遞參數非常繁瑣。所以以結構體作爲函數的入口參數的好處之一就是

函數的聲明void DsipDateTime( _calendar_obj  DateTimeVal)不需要改變,只需要增加結構體的成員變量,然後在函數的內部實現上對calendar.week作相應的處理即可。這樣,在程序的修改、維護方面作用顯著。

typedef struct   //公曆日期和時間結構體

{

    vu16  year;

    vu8   month;

    vu8   date;

    vu8  week;

    vu8   hour;

    vu8   min;

    vu8   sec;  

}_calendar_obj;  

 _calendar_obj calendar;  //定義結構體變量

 

    (3)結構體的內存對齊原則可以提高CPU對內存的訪問速度(以空間換取時間)
    並且,結構體成員變量的地址可以根據基地址
(以偏移量
offset)計算。我們先來看看下面的一段簡單的程序,對於此程序的分析會在第2部分結構體成員變量內存對齊中詳細說明。

 

#include<stdio.h>

 

int main()

{

    struct  //聲明結構體char_short_long

    {

        char  c;

        short s;

        long  l;

    }char_short_long;

 

    struct  //聲明結構體long_short_char

    {

        long  l;

        short s;

        char  c;
    }long_short_char;

 

    struct  //聲明結構體char_long_short

    {

        char  c;

        long  l;

        short s;

    }char_long_short;

 

    printf(" \n");

    printf(" Size of char   = %d bytes\n",sizeof(char));

    printf(" Size of shrot  = %d bytes\n",sizeof(short));

    printf(" Size of long   = %d bytes\n",sizeof(long));

    printf(" \n"); //char_short_long

    printf(" Size of char_short_long       = %d bytes\n",sizeof(char_short_long));

    printf("     Addr of char_short_long.c = 0x%p (10進制:%d)\n",&char_short_long.c,&char_short_long.c);

    printf("     Addr of char_short_long.s = 0x%p (10進制:%d)\n",&char_short_long.s,&char_short_long.s);

    printf("     Addr of char_short_long.l = 0x%p (10進制:%d)\n",&char_short_long.l,&char_short_long.l);

    printf(" \n");

 

    printf(" \n"); //long_short_char

    printf(" Size of long_short_char       = %d bytes\n",sizeof(long_short_char));

    printf("     Addr of long_short_char.l = 0x%p (10進制:%d)\n",&long_short_char.l,&long_short_char.l);

    printf("     Addr of long_short_char.s = 0x%p (10進制:%d)\n",&long_short_char.s,&long_short_char.s);

    printf("     Addr of long_short_char.c = 0x%p (10進制:%d)\n",&long_short_char.c,&long_short_char.c);

    printf(" \n");

 

    printf(" \n"); //char_long_short

    printf(" Size of char_long_short       = %d bytes\n",sizeof(char_long_short));

    printf("     Addr of char_long_short.c = 0x%p (10進制:%d)\n",&char_long_short.c,&char_long_short.c);

    printf("     Addr of char_long_short.l = 0x%p (10進制:%d)\n",&char_long_short.l,&char_long_short.l);

    printf("     Addr of char_long_short.s = 0x%p (10進制:%d)\n",&char_long_short.s,&char_long_short.s);

    printf(" \n");

    return 0;

}

 

程序的運行結果如下(注意:括號內的數據是成員變量的地址的十進制形式)



 

2. 結構體成員變量內存對齊

首先,我們來分析一下上面程序的運行結果。前三行說明在我的程序中,char型佔1個字節,short型佔2個字節,long型佔4個字節。char_short_longlong_short_charchar_long_short是三個結構體成員相同但是成員變量的排列順序不同。並且從程序的運行結果來看, 

       Size   of   char_short_long    = 8 bytes
    Size of long_short_char = 8 bytes
    Size of char_long_short = 12 bytes  //比前兩種情況大4 byte 

    並且,還要注意到,1 byte (char)+ 
2 byte (short)+ 4 byte (long) = 7 byte,而不是8 byte。

   所以,結構體成員變量的放置順序影響着結構體所佔的內存空間的大小。一個結構體變量所佔內存的大小不一定等於其成員變量所佔空間之和。如果一個用戶程序或者操作系統(比如uC/OS-II)中存在大量結構體變量時,這種內存佔用必須要進行優化,也就是說,結構體內部成員變量的排列次序是有講究的。

結構體成員變量到底是如何存放的呢?

在這裏,我就不賣關子了,直接給出如下結論,在沒有#pragma pack宏的情況下:

 

原則1  結構(struct或聯合union)的數據成員,第一個數據成員放在offset0的地方,以後每個數據成員存儲的起始位置要從該成員大小的整數倍開始(比如int32位機爲4字節,則要從4的整數倍地址開始存儲)。

原則2  結構體的總大小,也就是sizeof的結果,必須是其內部最大成員的整數倍,不足的要補齊。

   *原則3  結構體作爲成員時,結構體成員要從其內部最大元素大小的整數倍地址開始存儲。(struct a裏存有struct bb裏有charintdouble等元素,那b應該從8的整數倍地址處開始存儲,因爲sizeof(double) = 8 bytes

 

這裏,我們結合上面的程序來分析(暫時不討論原則3)

先看看char_short_longlong_short_char這兩個結構體,從它們的成員變量的地址可以看出來,這兩個結構體符合原則1和原則2。注意,在 char_short_long的成員變量的地址中, char_short_long.s的地址是1244994,也就是說,1244993是“空的”,只是被“佔位”了!

再看看char_long_short這個結構體,char_long_short的地址分佈情況如下表:

 

成員變量

成員變量十六進制地址

成員變量十進制地址

char_long_short.c

0x0012FF2C

1244972

char_long_short.l

0x0012FF30

1244976

char_long_short.s

0x0012FF34

1244980

 

可見,其內存分佈圖如下,共12 bytes

地址

1244972

1244973

1244974

1244975

1244976

1244977

1244978

1244979

1244980

1244981

1244982

1244983

成員

.c

 

 

 

.l

.s

 

 

 

首先,1244972能被1整除,所以char_long_short.c放在1244972處沒有問題(其實,就char型成員變量自身來說,其放在任何地址單元處都沒有問題),根據原則1,在之後的1244973~1244975中都沒有能被4(因爲sizeof(long)=4bytes)整除的,1244976能被4整除,所以char_long_short.l應該放在1244976處,那麼同理,最後一個.s(sizeof(short)=2 bytes)是應該放在1244980處。

是不是這樣就結束了?不是,還有原則2。根據原則2的要求,char_long_short這個結構體所佔的空間大小應該是其佔內存空間最大的成員變量的大小的整數倍。如果我們到此就結束了,那麼char_long_short所佔的內存空間是1244972~1244981共計10bytes,不符合原則2,所以,必須在最後補齊2個 bytes(1244982~1244983)

至此,一個結構體的內存佈局完成了。

下面我們按照上述原則,來驗證這樣的分析是不是正確。按上面的分析,地址單元124497312449741244975以及12449821244983都是空的(至少char_long_short未用到,只是“佔位”了)。如果我們的分析是正確的,那麼,定義這樣一個結構體,其所佔內存也應該是12 bytes

struct  //聲明結構體char_long_short_new

{

     char  c;

     char  add1;  //補齊空間
         char  add2;  //補齊空間
         char  add3;  //補齊空間

 

     long  l;

     short s;

     
         char  add4;  //補齊空間
         char  add5;  //補齊空間

 

}char_long_short_new;

 

運行結果如下:


 

可見,我們的分析是正確的。至於原則3,大家可以自己編程驗證,這裏就不再討論了。


    所以,無論你是在VC6.0還是Keil C51,還是Keil MDK中,當你需要定義一個結構體時,只要你稍微留心
結構體成員變量內存對齊這一現象,就可以在很大程度上節約MCURAM。這一點不僅僅應用於實際編程,在很多大型公司,比如IBM、微軟、百度、華爲的筆試和麪試中,也是常見的。



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章