Linux 下文件Non-ISO extended-ASCII編碼問題

原創

2020-02-20 13:34

Linux下，有時候我們需要將文件轉換爲另外一種編碼格式，如UTF-8，這個時候我們可以使用iconv工具轉換，但是如果遇到不確定的編碼，在轉換的時候就很麻煩，比如Non-ISO extended-ASCII。現有一個文件SogouQ.mini，查看其編碼如下：

[hadoopUser@secondmgt data]$ file SogouQ.mini 
SogouQ.mini: Non-ISO extended-ASCII English text, with very long lines

如果直接轉換會報以下錯誤

[hadoopUser@secondmgt data]$ iconv  -t UTF-8 SogouQ.mini >log.txt
iconv: illegal input sequence at position 48

這時候我們可以使用以下方式一個一個查找其源編碼

$ iconv --list | sed 's/\/\/$//' | sort > encodings.list
$ for a in `cat encodings.list`; do
  printf "$a  "
  iconv -f $a -t UTF-8 systeminfo.txt > /dev/null 2>&1 \
    && echo "ok: $a" || echo "fail: $a"
done | tee result.txt

遍歷result.txt文件中，查找嘗試那些沒有fail的編碼方式。最後-f CP850 -t UTF-8對我的文件正好。使用如下命令轉換：

iconv -f CP850 -t UTF-8 SogouQ.mini >SogouQueryLog.txt

查看轉換後的文件編碼：

[hadoopUser@secondmgt data]$ file SogouQueryLog.txt 
SogouQueryLog.txt: UTF-8 Unicode English text, with very long lines

由結果可知：轉換成功！

發佈了41 篇原創文章 · 獲贊 15 · 訪問量 22萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Sleep()函數失效的問題（WSL）

最近在協助同事安裝windows10 的Ubuntu子系統後，寫代碼時發現其調用sleep函數無效（現象是調用sleep直接返回，沒有阻塞效果）。查詢github WSL issues： https://github.co

2020-07-07 13:41:23

Linux入門番外篇——Xshell利用Xftp來方便地進行文件的上傳下載操作

首先，雙擊打開XShell工具，選中菜單欄中的窗口菜單，在其下拉列表中點擊傳輸新建文件選項，如下圖所示。此時，會打開本地Windows目錄和Linux的root目錄窗口，如下圖所示。然後，我們找到存放文件的地方，一次性選擇

2020-07-07 04:33:52

Linux入門番外篇——使用Xshell連接Linux服務器

我們在開發中經常會用到Linux服務器，爲方便操作服務器，我們一般會選擇一款軟件，比如SecureCRT，但今天我要推薦的是一款叫做Xshell的軟件。 Xshell+Xftp實測可用版本下載及安裝對於使用Linux服務器的朋友

2020-07-07 04:33:52

【Linux基礎學習4】修改文件屬性與權限——chgrp、chown、chmod

1.chgrp（修改所屬用戶組） wyy@ubuntu:~$ chgrp 目標用戶組文件名 2.chown（修改擁有者） 1）修改單一文件擁有者 wyy@ubuntu:~$ chown 目標賬號文件名 2）遞歸修改某目錄及

小小小小风丿

2020-06-21 03:44:22

【Linux基礎學習2】常用熱鍵[Tab]、[Ctrl+c]、[Ctrl+d]

1.[Tab] 1.命令補全：在第一個字段的輸入內容後緊接上兩次[Tab]鍵，顯示出以該內容爲開頭的所有命令 wyy@ubuntu:~$ ca[Tab][Tab] cal caller

小小小小风丿

2020-06-21 03:44:22

【Linux基礎學習1】bc——命令行模式中的簡單計算器

wyy@ubuntu:~$ bc bc 1.07.1 Copyright 1991-1994, 1997, 1998, 2000, 2004, 2006, 2008, 2012-2017 Free Software Foundat

小小小小风丿

2020-06-21 03:44:22

【Linux基礎學習3】文件權限與屬性

在命令行輸入[ls -al] [ls]命令的意思是“list”，用於列出文件名與相關屬性。 [-al]選項表示列出所有文件的詳細權限與屬性。 wyy@ubuntu:~$ ls -al total 228 drwxr-xr-x 26

小小小小风丿

2020-06-21 02:36:15

定時延時任務

10月28練習 1). 搜尋與raid相關的軟件有哪些? 2). 找出vsftpd這個軟件的功能是什麼? 3). 列出yum中提供的所有軟件包名稱. 4). 列出提供passwd文件的軟件有哪些? 5). 利用yum的功能,找出以pa

2020-06-20 01:41:31

linux練習11.04

1.每天晚上12點，取得/proc/meminfo文件中所有以S或M開頭的行，追加到/static/meminfo.txt 2.新建目錄/mytmp目錄，設置爲臨時文件，使存在8s以上的文件纔可以被清理 3

2020-06-20 01:41:31

redhat軟件的安裝

Redhat 下軟件的安裝。 1.軟件名稱識別 [abrt-addon-ccpp]-[2.1.11-19].[el7].[x86_64].rpm ##rpm結尾的適用與redhat操作系統 || |

2020-06-20 01:41:31

第21章軟件安裝：源代碼與 Tarball 練習題

情景模擬題請依照下面的方式來創建你係統的重要文件校驗值，並每日進行比對。將 /etc/{passwd,shadow,group} 以及系統上面所有的 SUID/SGID 文件建立文件列表，該列表文件名爲 importan

2020-06-16 16:13:20

第9章 vim 程序編輯器練習題

我用 vi 開啓某個文件後，要在第 34 行向右移動 15 個字符，應該在一般命令模式中執行什麼命令？ 34G 15→ 在 vi 打開的文件中，如何去到該文件的頁首或頁尾？ 1G 或 gg // 回到頁首 G //

2020-06-16 16:13:20

第5章 Linux 文件權限與目錄配置練習題

早期的 UNIX 系統文件名最多允許 14 個字符，而新的 UNIX 與 Linux 系統中，文件名最多可以使用幾個字符？答：最多可使用255個字符當一個一般文件權限爲 -rwxrwxrwx，則表示這個文件的意義是什麼？

2020-06-16 16:13:20

第6章 Linux 文件與目錄管理練習題

什麼是絕對路徑與相對路徑。答：絕對路徑是從根目錄"/“寫起的路徑，相對路徑是相對於當前目錄寫起的路徑，不以”/"開頭如何更改一個目錄的名稱？例如由 /home/test 變爲 /home/test2 cd /home

2020-06-16 16:13:20

Linux基礎命令實踐二

11、修改文件的權限分4個部分第一部分文件類型：d表示文件類型，代表目錄，文件類還有的-表示普通文件和l表示鏈接文件第二部分文件所有者的權限（r4：可讀權限、w2：可寫權限、x1：可執行權限）第三部分文件所在組的權限（r4：可

知更鸟的自由

2020-06-16 15:05:45

24小時熱門文章

最新文章

最新評論文章