近日被漢字亂碼搞的暈頭轉向,研究了不少文章,自己的問題還沒有最終解決,不過得到了一個副產品,找到了一個獲取漢字字符串編碼格式的可行方式:
String s = "漢字內容"; //這裏的漢字內容可能是從其它途徑獲取的,不知曉其編碼格式
String s1 = new String(s.getBytes(),"GBK"); //將漢字轉換爲GBK編碼或其它編碼
if(s1.equals(s)){
return "GBK";
}
s1 = new String(s.getBytes(),"UTF-8");
if(s1.equals(s)){
return "UTF-8";
}
//以此類推
通過比較原字符串和轉換爲新編碼格式後的字符串是否相等,即可判斷該字符串是否是這種編碼格式。這種方法有點笨,等於是一個個編碼格式去猜,在編碼格式範圍已知的情況下,可以一用