linux 下中文文件亂碼問題解決 原

經常遇到:windows下通過xftp上傳到linux服務器中的中文名文件出現亂碼的情況。

業務場景:有一個公共的下載目錄,裏面可能會有中文名的文件,在web端顯示的時候出現亂碼,導致下載出錯的問題。

首先保證linux的env設置了LANG=en_US.UTF-8

1、可以嘗試在使用xftp上傳問價你的時候,指定上傳過程中的編碼。如圖:

一般來說,這樣修改會解決亂碼的問題。

但如果在Shell中(或通過http訪問),仍是亂碼……

2、使用convmv 或 iconv

仍然亂碼的原因在於,Windows 的文件名中文編碼默認爲GBK,壓縮或者上傳後,文件名還會是GBK編碼,而Linux中默認文件名編碼爲UTF8,由於編碼不一致所以導致了文件名亂碼的問題,解決這個問題需要對文件名進行轉碼。

convmv和 iconv 都是linux下的更改文件編碼方式的工具。

安裝

使用root用戶安裝

#安裝iconv
yum install iconv

#convmv
yum install convmv

轉化文件編碼

使用root用戶執行命令

#iconv
iconv -f gbk -t utf-8 -o outfile  infile

-f爲原來的編碼方式,-t 爲輸出文件的編碼方式, -o表示輸出文件名,這利用outfile表示,最後跟上要更改編碼方式的文件名sourcefile。

#convmv 轉化命令 最後面跟文件目錄
convmv -f gbk -t utf-8 -r --notest /u01/appinstall/

就是將/u01/appinstall/目錄下原來文件名是gbk編碼方式的全部改爲utf-8格式的。這裏 -f  後面爲原來的編碼方式,-t 後面是要更改爲的編碼方式, -r 表示這個目錄下面的所有文件, –notest 表示馬上執行,而不是僅僅測試而已。

convmv常用命令

-r 遞歸處理子文件夾

–notest 真正進行操作,默認情況下是不對文件進行真實操作

–list 顯示所有支持的編碼

–unescap 可以做一下轉義,比如把%20變成空格

-i 交互模式(詢問每一個轉換,防止誤操作)

文本內容轉換 iconv

文件名轉換 convmv

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章