java 中文轉GBK碼

原文鏈接:https://www.cnblogs.com/lin2yatou/p/4362064.html

遇到一個需求,一個接口的調用時,需要將中文轉成對應的GBK碼,然後發請求調用,大概搜了下,貌似沒有簡單可行的現成方法,不像python能夠直接decode / encode。

找的時候有一個帖子給了啓示: java默認用Unicode存儲String,所以直接轉成某種編碼的byte的同時,就已經轉成了該編碼的encoding。

於是找了個例子,

天安門 對應的gbk碼是: %CC%EC%B0%B2%C3%C5

於是轉一下

byte[] bytes = source.getBytes("GBK");

再計算下補碼(還是反碼)神馬的。

for(byte b : bytes) {
sb.append("%" + Integer.toHexString((b & 0xff)).toUpperCase());
}

就得到了上述的CC EC B0 B2 C3 C5

按照格式塞進去百分號,大功告成。完整的函數如下:

public static String toGBK(String source) throws UnsupportedEncodingException {
        StringBuilder sb = new StringBuilder();
        byte[] bytes = source.getBytes("GBK");
        for(byte b : bytes) {
            sb.append("%" + Integer.toHexString((b & 0xff)).toUpperCase());
        }
        
        return sb.toString();
    }

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章