CRC從原理到實現

原文網址：http://blog.csdn.net/hqw/article/details/208925

CRC從原理到實現

===============

作者：Spark Huang([email protected])

日期：2004/12/8
摘要：CRC(Cyclic Redundancy Check)被廣泛用於數據通信過程中的差錯檢測，具有很強的

檢錯能力。本文詳細介紹了CRC的基本原理，並且按照解釋通行的查表算法的由來的思路介紹

了各種具體的實現方法。

1.差錯檢測

----------

數據通信中，接收端需要檢測在傳輸過程中是否發生差錯，常用的技術有奇偶校驗(Parity 

Check)，校驗和(Checksum)和CRC(Cyclic Redundancy Check)。它們都是發送端對消息按照

某種算法計算出校驗碼，然後將校驗碼和消息一起發送到接收端。接收端對接收到的消息按

照相同算法得出校驗碼，再與接收到的校驗碼比較，以判斷接收到消息是否正確。
奇偶校驗只需要1位校驗碼，其計算方法也很簡單。以奇檢驗爲例，發送端只需要對所有消息

位進行異或運算，得出的值如果是0，則校驗碼爲1，否則爲0。接收端可以對消息進行相同計

算，然後比較校驗碼。也可以對消息連同校驗碼一起計算，若值是0則有差錯，否則校驗通過。

通常說奇偶校驗可以檢測出1位差錯，實際上它可以檢測出任何奇數位差錯。
校驗和的思想也很簡單，將傳輸的消息當成8位(或16/32位)整數的序列，將這些整數加起來

而得出校驗碼，該校驗碼也叫校驗和。校驗和被用在IP協議中，按照16位整數運算，而且其

MSB(Most Significant Bit)的進位被加到結果中。
顯然，奇偶校驗和校驗和都有明顯的不足。奇偶校驗不能檢測出偶數位差錯。對於校驗和，

如果整數序列中有兩個整數出錯，一個增加了一定的值，另一個減小了相同的值，這種差錯

就檢測不出來。

2.CRC算法的基本原理

-------------------

CRC算法的是以GF(2)(2元素伽羅瓦域)多項式算術爲數學基礎的，聽起來很恐怖，但實際上它

的主要特點和運算規則是很好理解的。
GF(2)多項式中只有一個變量x，其係數也只有0和1，如：

    1*x^7 + 0*x^6 + 1*x^5 + 0*x^4 + 0*x^3 + 1*x^2 +1*x^1 + 1*x^0

即：

    x^7 + x^5 + x^2  + x + 1

(x^n表示x的n次冪)   
GF(2)多項式中的加減用模2算術執行對應項上係數的加減，模2就是加減時不考慮進位和借位，

即：

    0 + 0 = 0    0 - 0 = 0

    0 + 1 = 1    0 - 1 = 1 

    1 + 0 = 1    1 - 0 = 1

    1 + 1 = 0    1 - 1 = 0

顯然，加和減是一樣的效果(故在GF(2)多項式中一般不出現"-"號)，都等同於異或運算。例

如P1 = x^3  + x^2 + 1，P2 = x^3  + x^1 + 1，P1 + P2爲：
    x^3  + x^2 　　+ 1

  + x^3        + x + 1

    ------------------

           x^2 + x
GF(2)多項式乘法和一般多項式乘法基本一樣，只是在各項相加的時候按模2算術進行，例如

P1 * P2爲：
    (x^3 + x^2 + 1)(x^3 + x^1 + 1)

    = (x^6 + x^4 + x^3

     + x^5 + x^3 + x^2

     + x^3 + x + 1)

    = x^6 + x^5 + x^4 + x^3 + x^2 + x + 1
GF(2)多項式除法也和一般多項式除法基本一樣，只是在各項相減的時候按模2算術進行，例

如P3 = x^7 + x^6 + x^5 + x^2 + x，P3 / P2爲：
                                       x^4 + x^3           + 1

                    ------------------------------------------       

        x^3 + x + 1 )x^7 + x^6 + x^5 +             x^2 + x

                     x^7       + x^5 + x^4

                     ---------------------

                           x^6       + x^4 

                           x^6       + x^4 + x^3

                           ---------------------

                                             x^3 + x^2 + x

                                             x^3       + x + 1

                                             -----------------

                                                   x^2     + 1

CRC算法將長度爲m位的消息對應一個GF(2)多項式M，比如對於8位消息11100110，如果先傳輸

MSB，則它對應的多項式爲x^7 + x^6 + x^5 + x^2 + x。發送端和接收端約定一個次數爲r的

GF(2)多項式G，稱爲生成多項式，比如x^3 + x + 1，r = 3。在消息後面加上r個0對應的多

項式爲M'，顯然有M' = Mx^r。用M'除以G將得到一個次數等於或小於r - 1的餘數多項式R，

其對應的r位數值則爲校驗碼。如下所示：
             11001100

         -------------                         

    1011 )11100110000

          1011.......

          ----.......

           1010......

           1011......

           ----......           

              1110... 

              1011...

              ----...

               1010..

               1011..

               ----

                  100  <---校驗碼                                    
發送端將m位消息連同r位校驗碼(也就是M' + R)一起發送出去，接收端按同樣的方法算出收

到的m位消息的校驗碼，再與收到的校驗碼比較。接收端也可以用收到的全部m + r位除以生

成多項式，再判斷餘數是否爲0。這是因爲，M' + R = (QG + R) + R = QG，這裏Q是商。顯

然，它也可以像發送端一樣，在全部m + r後再增加r個0，再除以生成多項式，如果沒有差錯

發生，餘數仍然爲0。

3.生成多項式的選擇

------------------

很明顯，不同的生成多項式，其檢錯能力是不同的。如何選擇一個好的生成多項式需要一定

的數學理論，這裏只從一些側面作些分析。顯然，要使用r位校驗碼，生成多項式的次數應爲

r。生成多項式應該包含項"1"，否則校驗碼的LSB(Least Significant Bit)將始終爲0。如果

消息(包括校驗碼)T在傳輸過程中產生了差錯，則接收端收到的消息可以表示爲T + E。若E不

能被生成多項式G除盡，則該差錯可以被檢測出。考慮以下幾種情況：
    1)1位差錯，即E = x^n = 100...00，n >= 0。只要G至少有2位1，E就不能被G除盡。這

      是因爲Gx^k相當於將G左移k位，對任意多項式Q，QG相當於將多個不同的G的左移相加。

      如果G至少有兩位1，它的多個不同的左移相加結果至少有兩位1。

    2)奇數位差錯，只要G含有因子F = x + 1，E就不能被G除盡。這是因爲QG = Q'F，由1)

      的分析，F的多個不同的左移相加結果1的位數必然是偶數。
    3)爆炸性差錯，即E = (x^n + ... + 1)x^m = 1...100...00，n >= 1，m >= 0，顯然只

      要G包含項"1"，且次數大於n，就不能除盡E。

    4)2位差錯，即E = (x^n + 1)x^m = 100...00100...00，n >= 0。設x^n + 1 = QG + R，

      則E = QGx^m + Rx^m，由3)可知E能被G除盡當且僅當R爲0。因此只需分析x^n + 1，根

      據[3]，對於次數r，總存在一個生成多項式G，使得n最小爲2^r - 1時，才能除盡x^n 

      + 1。稱該生成多項式是原始的(primitive)，它提供了在該次數上檢測2位差錯的最高

      能力，因爲當n = 2^r - 1時，x^n + 1能被任何r次多項式除盡。[3]同時指出，原始

      生成多項式是不可約分的，但不可約分的的多項式並不一定是原始的，因此對於某些

      奇數位差錯，原始生成多項式是檢測不出來的。     

以下是一些標準的CRC算法的生成多項式：

    標準            多項式                                           16進製表示   

    ---------------------------------------------------------------------------  

    CRC12           x^12 + x^11 + x^3 + x^2 + x + 1                  80F

    CRC16           x^16 + x^15 + x^2 + 1                            8005

    CRC16-CCITT     x^16 + x^12 + x^5 + 1                            1021

    CRC32           x^32 + x^26 + x^23 + x^22 + x^16 + x^12 + x^11   04C11DB7

                    + x^10 + x^8 + x^7 + x^5 + x^4 + x^2 + x + 1

16進製表示去掉了最高次項，CCITT在1993年改名爲ITU-T。CRC12用於6位字節，其它用於8位

字節。CRC16在IBM的BISYNCH通信標準。CRC16-CCITT被廣泛用於XMODEM, X.25和SDLC等通信

協議。而以太網和FDDI則使用CRC32，它也被用在ZIP，RAR等文件壓縮中。在這些生成多項式

中，CRC32是原始的，而其它3個都含有因子x + 1。

4.CRC算法的實現

---------------

要用程序實現CRC算法，考慮對第2節的長除法做一下變換，依然是M = 11100110，G = 1011，

其係數r爲3。

             11001100                      11100110000     

         -------------                     1011    

    1011 )11100110000                      -----------

          1011.......                       1010110000    

          ----.......                      1010110000

           1010......                      1011

           1011......        ===>          -----------

           ----......                       001110000     

              1110...                      1110000

              1011...                      1011

              ----...                      -----------

               1010..                       101000        

               1011..                      101000

               ----                        1011

                  100  <---校驗碼          -----------

                                            00100         

                                            100           <---校驗碼

程序可以如下實現：

    1)將Mx^r的前r位放入一個長度爲r的寄存器；

    2)如果寄存器的首位爲1，將寄存器左移1位(將Mx^r剩下部分的MSB移入寄存器的LSB)，

      再與G的後r位異或，否則僅將寄存器左移1位(將Mx^r剩下部分的MSB移入寄存器的LSB)；

    3)重複第2步，直到M全部Mx^r移入寄存器；

    4)寄存器中的值則爲校驗碼。                                       
用CRC16-CCITT的生成多項式0x1021，其C代碼(本文所有代碼假定系統爲32位，且都在VC6上

編譯通過)如下：
unsigned short do_crc(unsigned char *message, unsigned int len)

{

    int i, j;

    unsigned short crc_reg;

    crc_reg = (message[0] << 8) + message[1];

    for (i = 0; i < len; i++) 

    {

        if (i < len - 2)

            for (j = 0; j <= 7; j++) 

            { 

                if ((short)crc_reg < 0)

                    crc_reg = ((crc_reg << 1) + (message[i + 2] >> (7 - i))) ^ 0x1021;

                else 

                    crc_reg = (crc_reg << 1) + (message[i + 2] >> (7 - i));      

            }

         else

            for (j = 0; j <= 7; j++) 

            { 

                if ((short)crc_reg < 0)

                    crc_reg = (crc_reg << 1) ^ 0x1021;

                else 

                    crc_reg <<= 1;             

            }         

    }

    return crc_reg;

} 
顯然，每次內循環的行爲取決於寄存器首位。由於異或運算滿足交換率和結合律，以及與0異

或無影響，消息可以不移入寄存器，而在每次內循環的時候，寄存器首位再與對應的消息位

異或。改進的代碼如下：
unsigned short do_crc(unsigned char *message, unsigned int len) 

{

    int i, j;

    unsigned short crc_reg = 0;

    unsigned short current;

    for (i = 0; i < len; i++) 

    {

        current = message[i] << 8;

        for (j = 0; j < 8; j++) 

        { 

            if ((short)(crc_reg ^ current) < 0)

                crc_reg = (crc_reg << 1) ^ 0x1021;

            else 

                crc_reg <<= 1; 

            current <<= 1;            

        }

    }

    return crc_reg;

}
以上的討論中，消息的每個字節都是先傳輸MSB，CRC16-CCITT標準卻是按照先傳輸LSB，消息

右移進寄存器來計算的。只需將代碼改成判斷寄存器的LSB，將0x1021按位顛倒後(0x8408)與

寄存器異或即可，如下所示：
unsigned short do_crc(unsigned char *message, unsigned int len) 

{

    int i, j;

    unsigned short crc_reg = 0;

    unsigned short current;

    for (i = 0; i < len; i++) 

    {

        current = message[i];

        for (j = 0; j < 8; j++) 

        { 

            if ((crc_reg ^ current) & 0x0001)

                crc_reg = (crc_reg >> 1) ^ 0x8408;

            else 

                crc_reg >>= 1; 

            current >>= 1;            

        }

    }

    return crc_reg;

}   
該算法使用了兩層循環，對消息逐位進行處理，這樣效率是很低的。爲了提高時間效率，通

常的思想是以空間換時間。考慮到內循環只與當前的消息字節和crc_reg的低字節有關，對該

算法做以下等效轉換：
unsigned short do_crc(unsigned char *message, unsigned int len) 

{

    int i, j;

    unsigned short crc_reg = 0;

    unsigned char  index;

    unsigned short to_xor;

    for (i = 0; i < len; i++) 

    {

        index = (crc_reg ^ message[i]) & 0xff; 

        to_xor = index;       

        for (j = 0; j < 8; j++) 

        { 

            if (to_xor & 0x0001)

                to_xor = (to_xor >> 1) ^ 0x8408;

            else 

                to_xor >>= 1;           

        }

        crc_reg = (crc_reg >> 8) ^ to_xor;

    }

    return crc_reg;

}
現在內循環只與index相關了，可以事先以數組形式生成一個表crc16_ccitt_table，使得

to_xor = crc16_ccitt_table[index]，於是可以簡化爲：
unsigned short do_crc(unsigned char *message, unsigned int len) 

{

    unsigned short crc_reg = 0; 

    while (len--) 

        crc_reg = (crc_reg >> 8) ^ crc16_ccitt_table[(crc_reg ^ *message++) & 0xff];

    return crc_reg;

}  
crc16_ccitt_table通過以下代碼生成：
int main()

{

    unsigned char index = 0;

    unsigned short to_xor;

    int i;
    printf("unsigned short crc16_ccitt_table[256] =/n{");

    while (1) 

    {

        if (!(index % 8))

            printf("/n");

        to_xor = index;       

        for (i = 0; i < 8; i++) 

        { 

            if (to_xor & 0x0001)

                to_xor = (to_xor >> 1) ^ 0x8408;

            else 

                to_xor >>= 1;           

        }            

        printf("0x%04x", to_xor);

        if (index == 255)

        {

            printf("/n");

            break;

        }

        else

        {

            printf(", ");

            index++;

        }

    }

    printf("};");

    return 0;

}
生成的表如下：
unsigned short crc16_ccitt_table[256] =

{

0x0000, 0x1189, 0x2312, 0x329b, 0x4624, 0x57ad, 0x6536, 0x74bf,

0x8c48, 0x9dc1, 0xaf5a, 0xbed3, 0xca6c, 0xdbe5, 0xe97e, 0xf8f7,

0x1081, 0x0108, 0x3393, 0x221a, 0x56a5, 0x472c, 0x75b7, 0x643e,

0x9cc9, 0x8d40, 0xbfdb, 0xae52, 0xdaed, 0xcb64, 0xf9ff, 0xe876,

0x2102, 0x308b, 0x0210, 0x1399, 0x6726, 0x76af, 0x4434, 0x55bd,

0xad4a, 0xbcc3, 0x8e58, 0x9fd1, 0xeb6e, 0xfae7, 0xc87c, 0xd9f5,

0x3183, 0x200a, 0x1291, 0x0318, 0x77a7, 0x662e, 0x54b5, 0x453c,

0xbdcb, 0xac42, 0x9ed9, 0x8f50, 0xfbef, 0xea66, 0xd8fd, 0xc974,

0x4204, 0x538d, 0x6116, 0x709f, 0x0420, 0x15a9, 0x2732, 0x36bb,

0xce4c, 0xdfc5, 0xed5e, 0xfcd7, 0x8868, 0x99e1, 0xab7a, 0xbaf3,

0x5285, 0x430c, 0x7197, 0x601e, 0x14a1, 0x0528, 0x37b3, 0x263a,

0xdecd, 0xcf44, 0xfddf, 0xec56, 0x98e9, 0x8960, 0xbbfb, 0xaa72,

0x6306, 0x728f, 0x4014, 0x519d, 0x2522, 0x34ab, 0x0630, 0x17b9,

0xef4e, 0xfec7, 0xcc5c, 0xddd5, 0xa96a, 0xb8e3, 0x8a78, 0x9bf1,

0x7387, 0x620e, 0x5095, 0x411c, 0x35a3, 0x242a, 0x16b1, 0x0738,

0xffcf, 0xee46, 0xdcdd, 0xcd54, 0xb9eb, 0xa862, 0x9af9, 0x8b70,

0x8408, 0x9581, 0xa71a, 0xb693, 0xc22c, 0xd3a5, 0xe13e, 0xf0b7,

0x0840, 0x19c9, 0x2b52, 0x3adb, 0x4e64, 0x5fed, 0x6d76, 0x7cff,

0x9489, 0x8500, 0xb79b, 0xa612, 0xd2ad, 0xc324, 0xf1bf, 0xe036,

0x18c1, 0x0948, 0x3bd3, 0x2a5a, 0x5ee5, 0x4f6c, 0x7df7, 0x6c7e,

0xa50a, 0xb483, 0x8618, 0x9791, 0xe32e, 0xf2a7, 0xc03c, 0xd1b5,

0x2942, 0x38cb, 0x0a50, 0x1bd9, 0x6f66, 0x7eef, 0x4c74, 0x5dfd,

0xb58b, 0xa402, 0x9699, 0x8710, 0xf3af, 0xe226, 0xd0bd, 0xc134,

0x39c3, 0x284a, 0x1ad1, 0x0b58, 0x7fe7, 0x6e6e, 0x5cf5, 0x4d7c,

0xc60c, 0xd785, 0xe51e, 0xf497, 0x8028, 0x91a1, 0xa33a, 0xb2b3,

0x4a44, 0x5bcd, 0x6956, 0x78df, 0x0c60, 0x1de9, 0x2f72, 0x3efb,

0xd68d, 0xc704, 0xf59f, 0xe416, 0x90a9, 0x8120, 0xb3bb, 0xa232,

0x5ac5, 0x4b4c, 0x79d7, 0x685e, 0x1ce1, 0x0d68, 0x3ff3, 0x2e7a,

0xe70e, 0xf687, 0xc41c, 0xd595, 0xa12a, 0xb0a3, 0x8238, 0x93b1,

0x6b46, 0x7acf, 0x4854, 0x59dd, 0x2d62, 0x3ceb, 0x0e70, 0x1ff9,

0xf78f, 0xe606, 0xd49d, 0xc514, 0xb1ab, 0xa022, 0x92b9, 0x8330,

0x7bc7, 0x6a4e, 0x58d5, 0x495c, 0x3de3, 0x2c6a, 0x1ef1, 0x0f78

};
這樣對於消息unsigned char message[len]，校驗碼爲：

    unsigned short code = do_crc(message, len);

並且按以下方式發送出去：

    message[len] = code & 0x00ff;

    message[len + 1] = (code >> 8) & 0x00ff; 

接收端對收到的len + 2字節執行do_crc，如果沒有差錯發生則結果應爲0。
在一些傳輸協議中，發送端並不指出消息長度，而是採用結束標誌，考慮以下幾種差錯：

    1)在消息之前，增加1個或多個0字節；

    2)消息以1個或多個連續的0字節開始，丟掉1個或多個0；

    3)在消息(包括校驗碼)之後，增加1個或多個0字節； 

    4)消息(包括校驗碼)以1個或多個連續的0字節結尾，丟掉1個或多個0； 

顯然，這幾種差錯都檢測不出來，其原因就是如果寄存器值爲0，處理0消息字節(或位)，寄

存器值不變。爲了解決前2個問題，只需寄存器的初值非0即可，對do_crc作以下改進：

unsigned short do_crc(unsigned short reg_init, unsigned char *message, unsigned int len)

{

    unsigned short crc_reg = reg_init; 

    while (len--) 

        crc_reg = (crc_reg >> 8) ^ crc16_ccitt_table[(crc_reg ^ *message++) & 0xff];

    return crc_reg;

}
在CRC16-CCITT標準中reg_init = 0xffff，爲了解決後2個問題，在CRC16-CCITT標準中將計

算出的校驗碼與0xffff進行異或，即：

    unsigned short code = do_crc(0xffff, message, len);

    code ^= 0xffff;

    message[len] = code & 0x00ff;

    message[len + 1] = (code >> 8) & 0x00ff;   

顯然，現在接收端對收到的所有字節執行do_crc，如果沒有差錯發生則結果應爲某一常值

GOOD_CRC。其滿足以下關係：

    unsigned char p[]= {0xff, 0xff}; 

    GOOD_CRC = do_crc(0, p, 2); 

其結果爲GOOD_CRC = 0xf0b8。

參考文獻

--------

[1] Ross N. Williams，"A PAINLESS GUIDE TO CRC ERROR DETECTION ALGORITHMS"，Version 3，

    http://www.ross.net/crc/crcpaper.html，August
1993

[2] Simpson, W., Editor, "PPP in HDLC Framing"，RFC 1549, December 1993

[3] P. E. Boudreau，W. C. Bergman and D. R. lrvin，"Performance of a cyclic redundancy

    check and its interaction with a data scrambler"，IBM J. RES. DEVELOP.，VOL.38

    NO.6，November 1994

版權聲明

--------

版權所有 (C) 2004 Spark Huang。最初發表在Spark Huang's Blog(http://blog.csdn.net/hqw)，

可以轉載，但是必須包含此版權聲明，並且禁止除排版外的一切改動。

主題推薦: 32位 performance 以太網標準通信

猜你在找: 深入瞭解crc32算法; H264 像素塊預測與運動補償; 《TCPIP詳解卷2實現》筆記--mbuf與輸入輸出UDP篇; CRC32 in c#; CRC校驗在STM32和C#中使用; 關於XVIDH264AVCX264的一些知識; ffmpeg支持的編解碼器和封裝格式; 走進STM32世界之Hex程序燒寫; 查表法計算CRC校驗碼代碼; h264檢測是I幀還是P幀解決錄像第一幀有馬賽克問題

準備好了麼？ 跳吧             ！更多職位盡在 CSDN
JOB
Android工程師

深圳市一車網絡科技有限公司
|
8-15K/月
我要跳槽
cocos2d-x工程師

北京天成創想科技有限公司
|
10-20K/月
我要跳槽
Java開發（中國移動融合通信）

新媒傳信(中國移動融合通信)
|
15-30K/月
我要跳槽
Android高級工程師

廣州緣創信息科技有限公司
|
4-6K/月
我要跳槽

id="ad_frm_0" frameborder="0" scrolling="no" src="http://blog.csdn.net/common/ad.html?t=4&containerId=ad_cen&frmId=ad_frm_0" style="border-width: 0px; overflow: hidden; width: 746px; height: 90px;">

查看評論

11樓 seekforhh 2013-07-19 11:13發表 [回覆]
好文！好文！絕逼好文！
10樓 Epsiloon 2011-12-12 14:21發表 [回覆] [引用] [舉報]
第一段的代碼好像還有一處錯誤：

unsigned short do_crc(unsigned char *message, unsigned int len)

{

int i, j;

unsigned short crc_reg;

crc_reg = (message[0] << 8) + message[1];

for (i = 0; i < len; i++)

{

if (i < len - 2)

for (j = 0; j <= 7; j++)

{

if ((short)crc_reg < 0)

crc_reg = ((crc_reg << 1) + (message[i + 2] >> (7 - j))&0x01) ^ 0x1021;

else

crc_reg = (crc_reg << 1) + (message[i + 2] >> (7 - j))&0x01; 

}

else

for (j = 0; j <= 7; j++)

{

if ((short)crc_reg < 0)

crc_reg = (crc_reg << 1) ^ 0x1021;

else

crc_reg <<= 1; 

} 

}

return crc_reg;

}

CRC從原理到實現

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

【2024-05-21】以茶會友

printf 十六進制格式化輸出 2字節補0對齊 ,

1K Xmodem文件傳輸協議

DS18B20 1-WIRE ROM搜索算法詳解

RTX51 Tiny中容易混淆的問題{轉}

Keil MDK : 標準IO函數重定向相關

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結