python-漢字編碼

note1, json.dumps:

因爲json.dumps 序列化時對中文默認使用的ascii編碼.想輸出真正的中文需要指定ensure_ascii=False
import json
print json.dumps(‘中文’,ensure_ascii=False)

 

note2, json.loads

加載後的字符串爲unicode格式

 

note3 漢字長度

unicode 一個漢字對應長度1

utf-8 一個漢字對應長度3

 

note3 encode, decode:

不管系統編碼如何,

UTF-8 等其他編碼--> decode 解碼 --> Unicode

Unicode --> encode 編碼 --> GBK / UTF-8 等其他編碼

如果unicode編碼再次進行decode(其他編碼),或者其他編碼多次decode(其他編碼),不一定百分百出錯。

 

 

 

 

 

 

 

https://www.cnblogs.com/yunguoxiaoqiao/p/7588725.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章