遇到一個需求,一個接口的調用時,需要將中文轉成對應的GBK碼,然後發請求調用,大概搜了下,貌似沒有簡單可行的現成方法,不像python能夠直接decode / encode。
找的時候有一個帖子給了啓示: java默認用Unicode存儲String,所以直接轉成某種編碼的byte的同時,就已經轉成了該編碼的encoding。
於是找了個例子,
天安門 對應的gbk碼是: %CC%EC%B0%B2%C3%C5
於是轉一下
byte[] bytes = source.getBytes("GBK");
再計算下補碼(還是反碼)神馬的。
for(byte b : bytes) {
sb.append("%" + Integer.toHexString((b & 0xff)).toUpperCase());
}
就得到了上述的CC EC B0 B2 C3 C5
按照格式塞進去百分號,大功告成。完整的函數如下:
public static String toGBK(String source) throws UnsupportedEncodingException {
StringBuilder sb = new StringBuilder();
byte[] bytes = source.getBytes("GBK");
for(byte b : bytes) {
sb.append("%" + Integer.toHexString((b & 0xff)).toUpperCase());
}
return sb.toString();
}