python中文字符解碼問題

在python中解碼中文的時候,可能報以下錯誤:

data.decode('gbk');

'gbk' codec can't decode bytes in position xxx illegal multibyte ...

可以嘗試把gbk換成'GB18030'

因爲gbk相對於gb2312包含的字符更多,但是GB18030包含的字符數又大於gbk.所以試試GB18030


題外話,按照一些理論GB18030有的時候也不好用。

最好的辦法就是在所有的程序設計和編碼的時候使用utf-8.



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章