IP、ICMP、UDP、TCP 校驗和算法

http://blog.csdn.net/li_xiang1102/article/details/6901660

以前看計算機網絡相關的書,每次看到IP或者UDP報頭校驗和時,都一瞥而過,以爲相當簡單,不就是16bit數據的相加嗎。最近在研究《TCP/IP詳解 卷1:協議》這本書,看到校驗和是16bit字的二進制反碼和(暈,以前都沒注意原來是反碼和,看來以前看書不仔細啊!罪過,罪過~~),覺得很奇怪,爲什麼會用反碼和,而不是直接求和呢?(因爲我認爲TCP/IP協議裏面的算法和思想一般都是非常經典的,人家這麼做一定有原因的)下面就來探索一下這個校驗和算法具體怎麼實現的。


         首先,IP、ICMP、UDP和TCP報文頭部都有校驗和字段,大小都是16bit,算法也基本一樣:

         在發送數據時,爲了計算數據包的校驗和。應該按如下步驟:

  (1)把校驗和字段置爲0;  (2)把需校驗的數據看成以16位爲單位的數字組成,依次進行二進制反碼求和;  (3)把得到的結果存入校驗和字段中。  在接收數據時,計算數據包的校驗和相對簡單,按如下步驟:  (1)把首部看成以16位爲單位的數字組成,依次進行二進制反碼求和,包括校驗和字段;  (2)檢查計算出的校驗和的結果是否爲0;  (3)如果等於0,說明被整除,校驗是和正確。否則,校驗和就是錯誤的,協議棧要拋棄這個數據包。




        雖然上面四種報文的校驗和算法一樣,但在作用範圍存在不同:IP校驗和只校驗20字節的IP報頭;而ICMP校驗和覆蓋整個報文(ICMP報頭+ICMP數據);UDP和TCP校驗和不僅覆蓋整個報文,而且還有12字節的IP僞首部,包括源IP地址(4字節)、目的IP地址(4字節)、協議(2字節,第一字節補0)和TCP/UDP包長(2字節)。另外UDP、TCP數據報的長度可以爲奇數字節,所以在計算校驗和時需要在最後增加填充字節0(注意,填充字節只是爲了計算校驗和,可以不被傳送)。

        這裏還要提一點,UDP的校驗和是可選的,當校驗和字段爲0時,表明該UDP報文未使用校驗和,接收方就不需要校驗和檢查了!那如果UDP校驗和的計算結果是0時怎麼辦呢?書上有這麼一句話:“如果校驗和的計算結果爲0,則存入的值爲全1(65535),這在二進制反碼計算中是等效的。


講了這麼多,那這個校驗和到底是怎麼算的呢?

1. 什麼是二進制反碼求和

        對一個無符號的數,先求其反碼,然後從低位到高位,按位相加,有溢出則向高位進1(跟一般的二進制加法規則一樣),若最高位有進位,則向最低位進1。

        首先這裏的反碼好像跟我們以前學的有符號數的反碼不一樣(即正數的反碼是其本身,負數的反碼是在其原碼的基礎上,符號位不變,其餘各位取反),這裏不分正負數,直接每個位都取反!

        上面加粗的那句是跟我們一般的加法規則不太一樣的地方:最高位有進位,則向最低位進1。確實有些疑惑,爲什麼要這樣做呢?仔細分析一下(爲了方便說明,以4bit二進制反碼求和舉例),上面的這種操作,使得在發生加法進位溢出時,溢出的值並不是10000,而是1111。也即是當相加結果滿1111時溢出,這樣也可以說明爲什麼0000和1111都表示0了(你同樣可以發現,任何數與這兩個數做二進制反碼求和運算結果都是原數,這恰好符合數0的加法意義)。

        下面再舉例兩種二進制反碼求和的運算:
        原碼加法運算                                              反碼加法運算
        3(0011)+ 5(0101)= 8(1000)      3(1100)+ 5(1010)=  8(0111)
        8(1000)+ 9(1001)= 1(0001)      8(0111)+ 9(0110)=  2(1101)
        從上面兩個例子可以看出,當加法未發生溢出時,原碼與反碼加法運算結果一樣;當有溢出時,結果就不一樣了,原碼是滿10000溢出,而反碼是滿1111溢出,所以相差正好是1。舉例只是爲了形象地觀察二進制反碼求和的運算規則,至於爲什麼要定義這樣的規則以及該運算規則還存在其它什麼特性,可能就需要涉及代數理論的東西的了(嗚嗚~~數學理論沒學好啊,只能從表面上分析分析)。

        另外關於二進制反碼求和運算需要說明的一點是,先取反後相加與先相加後取反,得到的結果是一樣的!(事實上我們的編程算法裏,幾乎都是先相加後取反。)



2. 校驗和算法的實現


講了什麼是二進制反碼求和,那麼校驗和的算法實現就簡單多了。廢話少說,直接上代碼:

[cpp] view plain copy

  1. //計算校驗和  

  2. USHORT checksum(USHORT *buffer,int size)  

  3. {  

  4.     unsigned long cksum=0;  

  5.     while(size>1)  

  6.     {  

  7.         cksum+=*buffer++;  

  8.         size-=sizeof(USHORT);  

  9.     }  

  10.     if(size)  

  11.     {  

  12.         cksum+=*(UCHAR *)buffer;  

  13.     }  

  14.     //將32位數轉換成16  

  15.     while (cksum>>16)  

  16.         cksum=(cksum>>16)+(cksum & 0xffff);  

  17.     return (USHORT) (~cksum);  

  18. }  

buffer是指向需校驗數據緩存區的指針,size是需校驗數據的總長度(字節爲單位)


4~13行代碼對數據按16bit累加求和,由於最高位的進位需要加在最低位上,所以cksum必須是32bit的unsigned long型,高16bit用於保存累加過程中的進位;另外代碼10~13行是對size爲奇數情況的處理!


14~16行代碼的作用是將cksum高16bit的值加到低16bit上,即把累加中最高位的進位加到最低位上。這裏使用了while循環,判斷cksum高16bit是否非零,因爲第16行代碼執行的時候,仍可能向cksum的高16bit進位。

有些地方是通過下面兩條代碼實現的:

cksum = (cksum >> 16) + (cksum & 0xffff); 
cksum += (cksum >>16);

這裏只進行了兩次相加,即可保證相加後cksum的高16位爲0,兩種方式的效果一樣。事實上,上面的循環也最多執行兩次!


17行代碼即對16bit數據累加的結果取反,得到二進制反碼求和的結果,然後函數返回該值。



3. 爲什麼使用二進制反碼求和呢?


        好了,最後一個問題,爲什麼要使用二進制反碼來計算校驗和呢,而不是直接使用原碼或者補碼?

        這個問題我想了很久,由於水平有限實在弄不明白,於是在百度上一陣狂搜,什麼都沒有(不知道是百度不給力,還是大家都不關注這個問題呢?)。果斷換google,敲了3個關鍵詞:why checksum tcp,嘿嘿 結果第二篇就是我想要的文章了!!!

先把鏈接給大家吧:http://www.netfor2.com/checksum.html

這篇文章主要介紹二進制反碼求和(the 1's complement sum)與補碼求和(the 2's complement sum)的區別,另外還說明了在TCP/IP校驗和中使用反碼求和的優點。


It may look awkword to use a 1's complement addition on 2's complement machines. This method however has its own benefits.

Probably the most important is that it is endian independent. Little Endian computers store hex numbers with the LSB last (Intel processors for example). Big Endian computers put the LSB first (IBM mainframes for example). When carry is added to the LSB to form the 1's complement sum (see the example) it doesn't matter if we add 03 + 01 or 01 + 03. The result is the same.

Other benefits include the easiness of checking the transmission and the checksum calculation plus a variety of ways to speed up the calculation by updating only IP fields that have changed.

        上面是原文的一部分,說明在TCP/IP校驗和中使用反碼求和的一些優點:

        a. 不依賴系統是大端還是小端。 即無論你是發送方計算或者接收方檢查校驗和時,都不需要調用htons 或者 ntohs,直接通過上面第2節的算法就可以得到正確的結果。這個問題你可以自己舉個例子,用反碼求和時,交換16位數的字節順序,得到的結果相同,只是字節順序相應地也交換了;而如果使用原碼或者補碼求和,得到的結果可能就不相同!

        b. 計算和驗證校驗和比較簡單,快速。說實話,這個沒怎麼看明白,感覺在校驗和計算方面,原碼或者補碼求和反而更簡單一些(從C語言角度),在校驗和驗證上面,通過一樣的算法判斷結果是否爲全0,確實要方便一些,所以可能從綜合考慮確實反碼求和要簡便一些。另外,IP報文在傳輸過程中,路由器經常只修改TTL字段(減1),此時路由器轉發該報文時可以直接增加它的校驗和,而不需要對IP整個首部進行重新計算。當然,可能從彙編語言的角度看,反碼求和還有很多高效的地方,這裏就不在深入追究了~~~


結語:本來一個不怎麼注意的地方,深入探究一下竟然發現這麼多東西。學習算法其實沒有必要抱着《算法導論》一頁一頁地啃(嘿嘿,哥也有一本哦),我更喜歡從TCP/IP協議或LInux內核原理中去探究算法以及實現思想,這樣反倒更有趣,而且這裏面的一些算法和思想相當經典,慢慢體會,必然受益匪淺!


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章