在python中解碼中文的時候,可能報以下錯誤:
data.decode('gbk');
'gbk' codec can't decode bytes in position xxx illegal multibyte ...
可以嘗試把gbk換成'GB18030'
因爲gbk相對於gb2312包含的字符更多,但是GB18030包含的字符數又大於gbk.所以試試GB18030
題外話,按照一些理論GB18030有的時候也不好用。
最好的辦法就是在所有的程序設計和編碼的時候使用utf-8.