在ubuntu下運行python程序,總是報錯,說編碼不對不是utf-8(貌似是因爲漢字部分出問題了),蒐集資料後完成了轉換。
1.文件編碼查詢
$ file 199801.txt
199801.txt: ISO-8859 text, with very long lines, with CRLF, LF line terminators
2.完成轉換
$ sudo iconv -f 'gbk' -t 'utf-8' 199801.txt > 199801_utf8.txt
3.不放心的可以再查一下
$ file 199801_utf8.txt
199801_utf8.txt: UTF-8 Unicode text, with very long lines, with CRLF, LF line terminators
此時編碼轉換已經完成,可以看到漢字部分已經正常了,o**k