今天在window平台下,用python读取一个txt文件出现下面错误:
UnicodeDecodeError: 'gbk' codec can't decode bytes in position 199-200: illegal multibyte sequence
错误意思:要将字符串解码为Unicode,是以gbk编码的方式去解码(该字符串变成Unicode)的但是此处通过gbk的方式,却无法解码,即文件的解码方式不对。
解决方法:
先查看自己文件的编码方式。查看文件的编码格式:点击打开链接
window下的文件编码格式为:ANSI
ANSI又分为:
GB2312,GBK,GB8030,Big5,Shift_JIS
结果将解码方式改为Shift_JIS就可以了。(当然不同文件有不同编码方式,就有不同的解码方式)。