歡迎加入 Python 官方文檔翻譯團隊:https://www.transifex.com/python-doc/
hashlib 模塊針對不同的安全哈希和消息摘要算法實現了一個通用的接口。提供了常見的摘要算法,如MD5,SHA1等等。
摘要算法又稱哈希算法、散列算法,摘要算法是單向加密的,也就是說明文通過摘要算法加密之後,是不能解密的。摘要算法的第二個特點密文是固定長度的,它通過一個函數,把任意長度的數據轉換爲一個長度固定的數據串(通常用16進制的字符串表示)。之所以叫摘要算法,它的算法就是提取明文重要的特徵。所以,兩個不同的明文,使用了摘要算法之後,有可能出現他們的密文的一樣,不過這個概率非常的低。
hashlib 模塊官方文檔:https://docs.python.org/3/library/hashlib.html
部分常用函數:
-
hashlib.new(name[, data]):指定算法,創建一個 hashable 對象
-
hash.update(data):傳遞類字節參數(通常是bytes)來更新hash對象,重複的調用相當於一個連接了所有參數的調用:
m.update(a)
;m.update(b)
相當於m.update(a+b)
。 -
hash.digest():返回摘要,作爲二進制數據字符串值
-
hash.hexdigest():返回摘要,作爲十六進制數據字符串值
MD5 算法示例
MD5 是常見的摘要算法,而單純的 MD5 加密並不安全,通過撞庫的方式,常見密碼的 MD5 值很容易就能查詢得到。
使用 hashlib.new()
方法來創建一個 hash 對象:
>>> import hashlib
>>> md5 = hashlib.new('md5', 'I love python!'.encode('utf-8'))
>>> md5.hexdigest()
'21169ee3acd4a24e1fcb4322cfd9a2b8'
也可以使用提供的接口指定具體調用方式:
>>> import hashlib
>>> md5 = hashlib.md5()
>>> md5.update('I love python!'.encode('utf-8'))
>>> md5.hexdigest()
'21169ee3acd4a24e1fcb4322cfd9a2b8'
數據量很大時,可以分塊多次調用 update()
,最後計算的結果是一樣的:
>>> import hashlib
>>> md5 = hashlib.md5()
>>> md5.update('I love '.encode('utf-8'))
>>> md5.update('python!'.encode('utf-8'))
>>> md5.hexdigest()
'21169ee3acd4a24e1fcb4322cfd9a2b8'
SHA1 算法示例
SHA1 是比 MD5 更安全一點的摘要算法,MD5 的密文是 32 位,而 SHA1 是 40 位,SHA1 的升級版還有 SHA256 和 SHA512,版本越強,密文越長,代價是速度越慢。
>>> import hashlib
>>> sha1 = hashlib.new('sha1', 'I love python!'.encode('utf-8'))
>>> sha1.hexdigest()
'23c02b203bd2e2ca19da911f1d270a06d86719fb'
或者:
>>> import hashlib
>>> sha1 = hashlib.sha1()
>>> sha1.update('I love python!'.encode('utf-8'))
>>> sha1.hexdigest()
'23c02b203bd2e2ca19da911f1d270a06d86719fb'
hash.digest() 轉化爲 hash.hexdigest()
以 MD5 算法爲例,首先使用兩種方法獲取一下字符串 Hello World
的 MD5 值:
>>> import hashlib
>>> md5 = hashlib.new('md5', b'Hello World')
>>> md5.hexdigest()
'b10a8db164e0754105b7a99be72e3fe5'
>>> md5.digest()
b'\xb1\n\x8d\xb1d\xe0uA\x05\xb7\xa9\x9b\xe7.?\xe5'
使用 binascii 模塊的 hexlify()
方法將 md5.digest()
轉化爲 md5.hexdigest()
結果:
>>> import binascii
>>> md5_hexdigest = binascii.hexlify(b'\xb1\n\x8d\xb1d\xe0uA\x05\xb7\xa9\x9b\xe7.?\xe5')
>>> md5_hexdigest
b'b10a8db164e0754105b7a99be72e3fe5'
hash.hexdigest() 轉化爲 hash.digest()
使用 binascii 模塊的 unhexlify()
方法將 md5.hexdigest()
轉化爲 md5.digest()
結果:
>>> import binascii
>>> md5_digest = binascii.unhexlify('b10a8db164e0754105b7a99be72e3fe5')
>>> md5_digest
b'\xb1\n\x8d\xb1d\xe0uA\x05\xb7\xa9\x9b\xe7.?\xe5'