中文與\u xxxx互轉碼
# 中文轉\u xxxx
name = '吳京'
name1 = name.encode('unicode_escape')
# b'\\u5434\\u4eac'
# \u xxxx轉中文
name2 = name1.decode('unicode_escape')
中文與 \x xx互轉碼
# 中文轉 \x xx
name3 = name.encode('utf-8')
# b'\xe5\x90\xb4\xe4\xba\xac'
# \x xx轉中文
name4 = name3.decode('utf-8')
中文與base64的互轉碼
# 中文轉base64
import base64
name3 = name.encode('utf-8')
name5 = base64.b64encode(name3)
# b'5ZC05Lqs'
# base64轉中文
name6 = base64.b64decode(name5)
# name6 == name3
name7 = name6.decode('utf-8')
總結
- 中文<–> \u xxxx
encode(‘unicode_escape’) <–> decode(‘unicode_escape’) - 中文 <–> \x xx
encode(‘utf-8’) <–> decode(‘utf-8’) - 中文 <–>base64
encode(‘utf-8’) --> base64.b64encode()
base64.b64decode() --> decode(‘utf-8’)
總之,中文轉其他編碼,就用encode()進行編碼,其他編碼轉中文就用decode()進行解碼.