ubuntu下txt文件編碼轉換、查詢(gbk/ISO-8859->utf-8)

原文鏈接:https://blog.csdn.net/qq_35014850/article/details/81407421

在ubuntu下運行python程序,總是報錯,說編碼不對不是utf-8(貌似是因爲漢字部分出問題了),蒐集資料後完成了轉換。

1.文件編碼查詢

$ file 199801.txt
199801.txt: ISO-8859 text, with very long lines, with CRLF, LF line terminators

2.完成轉換

$ sudo iconv -f 'gbk' -t 'utf-8' 199801.txt > 199801_utf8.txt

3.不放心的可以再查一下

$ file 199801_utf8.txt
199801_utf8.txt: UTF-8 Unicode text, with very long lines, with CRLF, LF line terminators

此時編碼轉換已經完成,可以看到漢字部分已經正常了,o**k

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章