note1, json.dumps:
因爲json.dumps 序列化時對中文默認使用的ascii編碼.想輸出真正的中文需要指定ensure_ascii=False
import json
print json.dumps(‘中文’,ensure_ascii=False)
note2, json.loads
加載後的字符串爲unicode格式
note3 漢字長度
unicode 一個漢字對應長度1
utf-8 一個漢字對應長度3
note3 encode, decode:
不管系統編碼如何,
UTF-8 等其他編碼--> decode 解碼 --> Unicode
Unicode --> encode 編碼 --> GBK / UTF-8 等其他編碼
如果unicode編碼再次進行decode(其他編碼),或者其他編碼多次decode(其他編碼),不一定百分百出錯。