計算機中的大端和小端二

 

大端(big-endian)和小端(little-endian)<轉>
2007-12-07 20:36

補:x86機是小端(修改分區表時要注意),單片機一般爲大端

    今天碰一個關於字節順序的問題,雖然看起來很簡單,但一直都沒怎麼完全明白這個東西,索性就找了下資料,把它弄清楚.
    因爲現行的計算機都是以八位一個字節爲存儲單位,那麼一個16位的整數,也就是C語言中的short,在內存中可能有兩種存儲順序big-endian和 litte-endian.考慮一個short整數0x3132(0x32是低位,0x31是高位),把它賦值給一個short變量,那麼它在內存中的存 儲可能有如下兩種情況:
大端字節(Big-endian):
----------------->>>>>>>>內存地址增大方向
short變量地址
       0x1000                  0x1001
_____________________________
|                           |
|         0x31             |       0x32
|_______________ | ________________
高位字節在低位字節的前面,也就是高位在內存地址低的一端.可以這樣記住(大端->高位->在前->正常的邏輯順序)
小端字節(little-endian):
----------------->>>>>>>>內存地址增大方向
short變量地址
       0x1000                  0x1001
_____________________________
|                           |

|         0x32             |       0x31

|________________ | ________________

低位字節在高位字節的前面,也就是低位在內存地址低的一端.可以這樣記住(小端->低位->在前->與正常邏輯順序相反)
可以做個實驗
在windows上下如下程序
#include <stdio.h>
#include <assert.h>
void main( void )
{
        short test;

        FILE* fp;

        
        test = 0x3132; //(31ASIIC
碼的’1’,32ASIIC碼的’2’)
        if ((fp = fopen ("c://test.txt", "wb")) == NULL)
              assert(0);
        fwrite(&test, sizeof(short), 1, fp);
        fclose(fp);
}
    然後在C盤下打開test.txt文件,可以看見內容是21,而test等於0x3132,可以明顯的看出來x86的字節順序是低位在前.如果我們把這段 同樣的代碼放到(big-endian)的機器上執行,那麼打出來的文件就是12.這在本機中使用是沒有問題的.但當你把這個文件從一個big- endian機器複製到一個little-endian機器上時就出現問題了.
    如上述例子,我們在big-endian的機器上創建了這個test文件,把其複製到little-endian的機器上再用fread讀到一個 short裏面,我們得到的就不再是0x3132而是0x3231了,這樣讀到的數據就是錯誤的,所以在兩個字節順序不一樣的機器上傳輸數據時需要特別小 心字節順序,理解了字節順序在可以幫助我們寫出移植行更高的代碼.
正因爲有字節順序的差別,所以在網絡傳輸的時候定義了所有字節順序相關的數據都使用big-endian,BSD的代碼中定義了四個宏來處理:
#define ntohs(n)     //網絡字節順序到主機字節順序 n代表net, h代表host, s代表short
#define htons(n)     //主機字節順序到網絡字節順序 n代表net, h代表host, s代表short
#define ntohl(n)      //網絡字節順序到主機字節順序 n代表net, h代表host, s代表 long
#define htonl(n)      //主機字節順序到網絡字節順序 n代表net, h代表host, s代表 long
舉例說明下這其中一個宏的實現:
#define sw16(x) /
    ((
short)( /
        (((
short)(x) & (short)0x00ffU) << 8) | /
        (((
short)(x) & (short)0xff00U) >> 8) ))
這裏實現的是一個交換兩個字節順序.其他幾個宏類似.

我們改寫一下上面的程序
#include <stdio.h>
#include <assert.h>

#define sw16(x) /
    ((short)( /
        (((short)(x) & (short)0x00ffU) << 8) | /

        (((short)(x) & (short)0xff00U) >> 8) ))

// 因爲x86下面是低位在前,需要交換一下變成網絡字節順序
#define htons(x) sw16(x)
void main( void )
{
        short test;

        FILE* fp;
       
        test = htons(0x3132); //(31ASIIC
碼的’1’,32ASIIC碼的’2’)
       
if ((fp = fopen ("c://test.txt", "wb")) == NULL)
              assert(0);
        fwrite(&test, sizeof(short), 1, fp);
        fclose(fp);
}
    如果在高字節在前的機器上,由於與網絡字節順序一致,所以我們什麼都不幹就可以了,只需要把#define htons(x) sw16(x)宏替換爲 #define htons(x) (x).
    一開始我在理解這個問題時,總在想爲什麼其他數據不用交換字節順序?比如說我們write一塊buffer到文件,最後終於想明白了,因爲都是unsigned char類型一個字節一個字節的寫進去,這個順序是固定的,不存在字節順序的問題,夠笨啊..
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章