Python的hashlib提供了常見的摘要算法,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法。
摘要算法又稱哈希算法、散列算法。它通過一個函數,把任意長度的數據轉換爲一個長度固定的數據串(通常用16進制的字符串表示)。
以常見的摘要算法MD5爲例,計算出一個字符串的MD5值:
import hashlib MD5 = hashlib.md5() MD5.update(bytes('how to use md5 in python hashlib?',encoding='utf-8')) print(MD5.hexdigest()) d26a53750bc40b38b65a520292f69306
如果數據量很大,可以分塊多次調用update(),最後計算的結果是一樣的:
import hashlib MD5 = hashlib.md5() MD5.update(bytes('how to use md5 in ',encoding='utf-8')) MD5.update(bytes('python hashlib?',encoding'utf-8')) print(MD5.hexdigest())
改動一個字母,看看計算的結果是否完全不同。
MD5是最常見的摘要算法,速度很快,生成結果是固定的128 bit字節,通常用一個32位的16進制字符串表示。另一種常見的摘要算法是SHA1,調用SHA1和調用MD5完全類似:
import hashlib SHA1 = hashlib.sha1() SHA1.update(bytes('how to use sha1 in ',encoding='utf-8')) SHA1.update(bytes('python hashlib?',encoding='utf-8')) print(SHA1.hexdigest())
SHA1的結果是160 bit字節,通常用一個40位的16進制字符串表示。
比SHA1更安全的算法是SHA256和SHA512,不過越安全的算法不僅越慢,而且摘要長度更長。
以上加密算法雖然依然非常厲害,但時候存在缺陷,即:通過撞庫可以反解。所以,有必要對加密算法中添加自定義key再來做加密。
import hashlib hash = hashlib.md5(bytes('898oaFs09f',encoding="utf-8")) hash.update(bytes('admin',encoding="utf-8")) print(hash.hexdigest())
摘要算法應用
任何允許用戶登錄的網站都會存儲用戶登錄的用戶名和口令。如何存儲用戶名和口令呢?方法是存到數據庫表中:
name | password --------+---------- michael | asddasda lzj | ddecewad erics | se232cw3
以明文保存用戶口令,如果數據庫泄露,所有用戶的口令就落入***的手裏;正確的保存口令的方式是不存儲用戶的明文口令,而是存儲用戶口令的摘要,比如MD5:
username | password ---------+--------------------------------- michael | e10adc3949ba59abbe56e057f20f883e lzj | 878ef96e86145580c38c87f0410ad153 erics | 99b1c2188db85afee403b1536010c2c9
當用戶登錄時,首先計算用戶輸入的明文口令的MD5,然後和數據庫存儲的MD5對比,如果一致,說明口令輸入正確,如果不一致,口令肯定錯誤。