java中獲取漢字字符串編碼格式的一種可行方式

愚園 jiangnanyuzi的專欄 http://blog.csdn.net/jiangnanyuzi/archive/2008/01/31/2075459.aspx

近日被漢字亂碼搞的暈頭轉向,研究了不少文章,自己的問題還沒有最終解決,不過得到了一個副產品,找到了一個獲取漢字字符串編碼格式的可行方式:

String s = "漢字內容";   //這裏的漢字內容可能是從其它途徑獲取的,不知曉其編碼格式
String s1 = new String(s.getBytes(),"GBK");  //將漢字轉換爲GBK編碼或其它編碼
if(s1.equals(s)){
return "GBK";
}
s1 = new String(s.getBytes(),"UTF-8");
if(s1.equals(s)){
return "UTF-8";
}
//以此類推

通過比較原字符串和轉換爲新編碼格式後的字符串是否相等,即可判斷該字符串是否是這種編碼格式。這種方法有點笨,等於是一個個編碼格式去猜,在編碼格式範圍已知的情況下,可以一用

 

發佈了9 篇原創文章 · 獲贊 2 · 訪問量 12萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章