MD5 & SHA1 加密

什麼是MD5,什麼是SHA-1,如何校驗這些Hash。還有拿單個ISO文件的MD5,SHA-1訊問是不是原版的問題,在這裏,對以上問題做一個終結解釋!

讓我們先來了解一些基本知識,瞭解hash。

Hash,一般翻譯做“散列”,也有直接音譯爲”哈希”的,就是把任意長度的輸入(又叫做預映射,pre-image),通過散列算法,變換成固定長度的輸出,該輸出就是散列值。這種轉換是一種壓縮映射,也就是,散列值的空間通常遠小於輸入的空間,不同的輸入可能會散列成相同的輸出,而不可能從散列值來唯一的確定輸入值。

簡單的說就是一種將任意長度的消息壓縮到某一固定長度的消息摘要的函數。

HASH主要用於信息安全領域中加密算法,他把一些不同長度的信息轉化成雜亂的128位的編碼裏,叫做HASH值.也可以說,hash就是找到一種數據內容和數據存放地址之間的映射關係

瞭解了hash基本定義,就不能不提到一些著名的hash算法,MD5和SHA1可以說是目前應用最廣泛的Hash算法,而它們都是以MD4爲基礎設計的。那麼他們都是什麼意思呢?

這裏簡單說一下:

1)MD4

MD4(RFC1320)是MIT的RonaldL.Rivest在1990年設計的,MD是MessageDigest的縮寫。它適用在32位字長的處理器上用高速軟件實現–它是基於32位操作數的位操作來實現的。

2)MD5

MD5(RFC1321)是Rivest於1991年對MD4的改進版本。它對輸入仍以512位分組,其輸出是4個32位字的級聯,與MD4相同。MD5比MD4來得複雜,並且速度較之要慢一點,但更安全,在抗分析和抗差分方面表現更好。

MD5是一種不可逆的加密算法,目前是最牢靠的加密算法之一,尚沒有能夠逆運算的程序被開發出來,它對應任何字符串都可以加密成一段唯一的固定長度的代碼。

那麼它有什麼用呢?很簡單,通過它可以判斷原始值是否正確(是否被更改過)。一般用於密碼的加密。而我們所提供的MD5校驗碼就是針對安裝程序的唯一對應的一段代碼。你可以使用任何MD5運算器對下載的文件進行運算,運算出來的結果如果完全符合我們提供的MD5校驗碼,那麼說明你下載的這個程序沒有被中途修改過。

這個特徵碼有如下特性,首先它不可逆,例如我有一段祕密的文字如:”MySecretWords”,經算法變換後得到MD5碼(b9944e9367d2e40dd1f0c4040d4daaf7),把這個碼告訴其他人,他們根據這個MD5碼是沒有系統的方法可以知道你原來的文字是什麼的。

其次,這個碼具有高度的離散性,也就是說,原信息的一點點變化就會導致MD5的巨大變化,例如”ABC”MD5(902fbdd2b1df0c4f70b4a5d23525e932)和”ABC”(多了一空格)MD5(12c774468f981a9487c30773d8093561)差別非常大,而且之間沒有任何關係,也就是說產生的MD5碼是不可預測的。

最後由於這個碼有128位那麼長,所以任意信息之間具有相同MD5碼的可能性非常之低,通常被認爲是不可能的。

所以一般認爲MD5碼可以唯一地代表原信息的特徵,通常用於密碼的加密存儲,數字簽名,文件完整性驗證等。

3)SHA1及其他

SHA1是由NISTNSA設計爲同DSA一起使用的,它對長度小於264的輸入,產生長度爲160bit的散列值,因此抗窮舉(brute-force)性更好。SHA-1設計時基於和MD4相同原理,並且模仿了該算法。SHA-1是由美國標準技術局(NIST)頒佈的國家標準,是一種應用最爲廣泛的hash函數算法,也是目前最先進的加密技術,被政府部門和私營業主用來處理敏感的信息。而SHA-1基於MD5,MD5又基於MD4。

論壇裏提供的系統鏡像文件的hash也就是微軟官方提供的SHA-1值,下載後和此值對應,就說明你下載過程中文件沒有被更改,屬於原版。

什麼是CRC

CRC的全稱爲CyclicRedundancyCheck,中文名稱爲循環冗餘校驗。它是一類重要的線性分組碼,編碼和解碼方法簡單,檢錯和糾錯能力強,在通信領域廣泛地用於實現差錯控制。實際上,除數據通信外,CRC在其它很多領域也是大有用武之地的。例如我們讀軟盤上的文件,以及解壓一個ZIP文件時,偶爾會碰到“BadCRC”錯誤,由此它在數據存儲方面的應用可略見一斑。

那麼這些Hash算法到底有什麼用呢?

Hash算法在信息安全方面的應用主要體現在以下的3個方面:

1)文件校驗

我們比較熟悉的校驗算法有奇偶校驗和CRC校驗,這2種校驗並沒有抗數據篡改的能力,它們一定程度上能檢測並糾正數據傳輸中的信道誤碼,但卻不能防止對數據的惡意破壞。

MD5Hash算法的”數字指紋”特性,使它成爲目前應用最廣泛的一種文件完整性校驗和(Checksum)算法,不少Unix系統有提供計算md5checksum的命令。

2)數字簽名

Hash算法也是現代密碼體系中的一個重要組成部分。由於非對稱算法的運算速度較慢,所以在數字簽名協議中,單向散列函數扮演了一個重要的角色。對Hash值,又稱”數字摘要”進行數字簽名,在統計上可以認爲與對文件本身進行數字簽名是等效的。而且這樣的協議還有其他的優點。

3)鑑權協議

如下的鑑權協議又被稱作”挑戰–認證模式:在傳輸信道是可被偵聽,但不可被篡改的情況下,這是一種簡單而安全的方法。

當然,hash函數並不是完全可靠,不同文件產生相同MD5和SHA1的機率還是有的,只是不高,在我們論壇裏提供的系統光盤,你想對這麼幾個文件存在相同HASH的不同文件根本是不可能的。

論壇MSDN版塊,提供的就是微軟發佈MSDN提供給程序員研究的Windows系統的鏡像的HASH值——SHA-1,不提供MD5因爲微軟只提供了SHA1。而論壇發佈區發佈的鏡像是和這些值對應的鏡像,你校驗自己的鏡像的HASH和MSDN信息區相應版本的SHA-1對應的上,說明你手中的光盤是微軟通過MSDN發佈的原盤。對不上還存在屬於零售或通過銷售渠道發佈的鏡像的可能。畢竟MSDN只是微軟發佈系統光盤的一個途徑,MSDN只是給程序開發人員研究用的。

尋求原版的證實,對應SHA-1和MD5外,CRC的認證也是一個很重要的因素,CRC同樣是校驗文件的完整性,還有CDIMGE的封裝版本。

微軟出品的鏡像都能通過CRC驗證,當然也有人使用CRC自己進行製作可以得到通過CRC的鏡像,那麼這時候你需要對應鏡像的SHA-1等了,所以,驗證一個鏡像的原盤可以通過對應多個數值來完成。

隨着信息技術和Internet 的迅速發展,信息安全和可靠性問題越來越重要。現在信息安全面臨兩大基本攻擊:被動式攻擊(獲取消息的內容、業務流分析)和主動攻擊(假冒、消息的篡改、業務拒絕)。前者主要靠加密和解密技術進行有效處理,而後者就要靠消息認證來處理。在金融交易、電子商務、電子信件、手機用戶信息的確認等領域,數據完整性確認和數據來源的真僞鑑定都是很重要的安全服務。實現這些安全服務的最好方法就是使用加密函數中的單項散列(Hash)函數。單項散列(Hash)函數是一種單項密碼體制,它是一個從明文到密文的不可逆函數,也就是說,是無法解密的。通常應用在只需要加密、不需要解密的特殊應用場合。單項散列(Hash)函數H(M)作用於一任意長度的消息M,它返回一固定長度的散列值h:h=H(M)作爲初始消息的獨一無二的“數字指紋”,從而能保證數據的完整性和惟一性。
3.1 MD5 與SHA-1 的比較
由於MD5 與SHA-1均是從MD4 發展而來,它們的結構和強度等特性有很多相似之處,表(1)是對MD5與SHA-1 的結構比較。SHA-1與MD5 的最大區別在於其摘要比MD5 摘要長 32 比特。對於強行攻擊,產生任何一個報文使之摘要等於給定報文摘要的難度:MD5 是2128 數量級的操作,SHA-1 是2160 數量級的操作。產生具有相同摘要的兩個報文的難度:MD5是 264 是數量級的操作,SHA-1 是280 數量級的操作。因而,SHA-1 對強行攻擊的強度更大。但由於SHA-1 的循環步驟比MD5 多(80:64)且要處理的緩存大(160 比特:128 比特),SHA-1 的運行速度比MD5 慢。
5 結束語
MD5 和SHA-1 是單項散列函數的典型代表,它們廣泛地應用在信息安全和數字簽名等各個領域。從而有效地抗擊了信息的主動式攻擊,本文基於AVR 單片機實現了這兩種算法,並結合彙編語言盡心了優化,取得了較好的效果。根據信息安全的要求的不同層次可以靈活選擇這兩種算法從而達到實際目的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章