C語言聯合體union

C語言中的聯合體union
在C/C++程序的編寫中,當多個基本數據類型或複合數據結構要佔用同一片內存時,我們要使用聯合體;當多種類型,多個對象,多個事物只取其一時(我們姑且通俗地稱其爲“n 選1”),我們也
可以使用聯合體來發揮其長處。首先看一段代碼:
union myun
{
 struct { int x; int y; int z; }u;
 int k;
}a;
int main()
{
 a.u.x =4;
 a.u.y =5;
 a.u.z =6;
 a.k = 0;
 printf("%d %d %d/n",a.u.x,a.u.y,a.u.z);
 return 0;
}
union類型是共享內存的,以size最大的結構作爲自己的大小,這樣的話,myun這個結構就包含u這個結構體,而大小也等於u這個結構體的大小,在內存中的排列爲聲明的順序x,y,z從低到高,然後賦值的時候,在內存中,就是x的位置放置4,y的位置放置5,z的位置放置6,現在對k賦值,對k的賦值因爲是union,要共享內存,所以從union的首地址開始放置,首地址開始的位置其實是x的位置,這樣原來內存中x的位置就被k所賦的值代替了,就變爲0了,這個時候要進行打印,就直接看內存裏就行了,x的位置也就是k的位置是0,而y,z的位置的值沒有改變,所以應該是0,5,6
 
再看兩個試題:
試題一:編寫一段程序判斷系統中的CPU 是Little endian 還是Big endian 模式?
分析:
作爲一個計算機相關專業的人,我們應該在計算機組成中都學習過什麼叫Little endian 和Big endian。Little endian 和Big endian 是CPU 存放數據的兩種不同順序。對於整型、長整型等數據類型,Big endian 認爲第一個字節是最高位字節(按照從低地址到高地址的順序存放數據的高位字節到低位字節);而Little endian 則相反,它認爲第一個字節是最低位字節(按照從低地址到高地址的順序存放數據的低位字節到高位字節)。
例如,假設從內存地址0x0000 開始有以下數據:
0x12 0x34 0xab 0xcd
如果我們去讀取一個地址爲0x0000 的四個字節變量,若字節序爲big-endian,則讀出結果爲0x1234abcd;若字節序位little-endian,則讀出結果爲0xcdab3412。如果我們將0x1234abcd 寫入到以0x0000 開始的內存中,則Little endian 和Big endian 模式的存放結果如下:
地址               0x0000 0x0001 0x0002 0x0003
big-endian         0x12   0x34   0xab   0xcd
little-endian      0xcd   0xab   0x34   0x12
一般來說,x86 系列CPU 都是little-endian 的字節序,PowerPC 通常是Big endian,還有的CPU 能通過跳線來設置CPU 工作於Little endian 還是Big endian 模式。
解答:
顯然,解答這個問題的方法只能是將一個字節(CHAR/BYTE 類型)的數據和一個整型數據存放於同樣的內存
開始地址,通過讀取整型數據,分析CHAR/BYTE 數據在整型數據的高位還是低位來判斷CPU 工作於Little
endian 還是Big endian 模式。得出如下的答案:
typedef unsigned char BYTE;
int main(int argc, char* argv[])
{
unsigned int num,*p;
p = #
num = 0;
*(BYTE *)p = 0xff;
if(num == 0xff)
{
printf("The endian of cpu is little/n");
}
else //num == 0xff000000
{
printf("The endian of cpu is big/n");
}
return 0;
}
除了上述方法(通過指針類型強制轉換並對整型數據首字節賦值,判斷該賦值賦給了高位還是低位)外,還有沒
有更好的辦法呢?我們知道,union 的成員本身就被存放在相同的內存空間(共享內存,正是union 發揮作用、做貢獻的去處),因此,我們可以將一個CHAR/BYTE 數據和一個整型數據同時作爲一個union 的成員,得出
如下答案:
int checkCPU()
{
 {
  union w
 {
  int a;
  char b;
 } c;
 c.a = 1;
 return (c.b == 1);
 }
}

實現同樣的功能,我們來看看Linux 操作系統中相關的源代碼是怎麼做的:
static union { char c[4]; unsigned long mylong; } endian_test = {{ 'l', '?', '?', 'b' } };

#define ENDIANNESS ((char)endian_test.mylong)
Linux 的內核作者們僅僅用一個union 變量和一個簡單的宏定義就實現了一大段代碼同樣的功能!由以上一段代碼我們可以深刻領會到Linux 源代碼的精妙之處!(如果ENDIANNESS=’l’表示系統爲little endian,
爲’b’表示big endian )
試題二:假設網絡節點A 和網絡節點B 中的通信協議涉及四類報文,報文格式爲“報文類型字段+報文內容的結構體”,四個報文內容的結構體類型分別爲STRUCTTYPE1~ STRUCTTYPE4,請編寫程序以最簡單的方式組
織一個統一的報文數據結構。

分析:
報文的格式爲“報文類型+報文內容的結構體”,在真實的通信中,每次只能發四類報文中的一種,我們可以將四類報文的結構體組織爲一個union(共享一段內存,但每次有效的只是一種),然後和報文類型字段統一組織成一個報文數據結構。
解答:
根據上述分析,我們很自然地得出如下答案:
typedef unsigned char BYTE;
//報文內容聯合體
typedef union tagPacketContent
{
STRUCTTYPE1 pkt1;
STRUCTTYPE2 pkt2;
STRUCTTYPE3 pkt1;
STRUCTTYPE4 pkt2;
}PacketContent;
//統一的報文數據結構
typedef struct tagPacket
{
BYTE pktType;
PacketContent pktContent;
}Packet;
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章