python中文字符解码问题

在python中解码中文的时候,可能报以下错误:

data.decode('gbk');

'gbk' codec can't decode bytes in position xxx illegal multibyte ...

可以尝试把gbk换成'GB18030'

因为gbk相对于gb2312包含的字符更多,但是GB18030包含的字符数又大于gbk.所以试试GB18030


题外话,按照一些理论GB18030有的时候也不好用。

最好的办法就是在所有的程序设计和编码的时候使用utf-8.



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章