不同的編碼字節個數不一樣的【以下列舉常見三種編碼形式】:
GBK:一個漢字等於2字節,一個字母就等於1個字節,操作符等於1個字節。
UTF-8:一個漢字等於3個字節,中文句號‘。’等於3個字節,一個字母等於1字節,英文的句號‘.’等於1個字節
Unicode:一個漢字等於4個字節,都是等於2個字節【英語,數字,操作符[。,%,&]等的呢】
public class zijie {
public static void main(String[] args) {
// 得到當前的系統屬性
String encoding = System.getProperty("file.encoding");
System.out.println("當前編碼:" + encoding);
try {
String str = "([0.04245922968394873,0.35328006651790006,6.160877241621716E-4,3.2568745892276585E-4,4.082970851109664E-4,0.33464432678726974,5.467903501318759E-4,0.2677195143925537],ListBuffer(((6.226147480536253,289),27), ((5.971384772976431,595),53), ((3.216778047230726,7840),54)))";
// String str = "JTI4JTVCMC4wNDI0NTkyMjk2ODM5NDg3MyUyQzAuMzUzMjgwMDY2NTE3OTAwMDYlMkM2LjE2MDg3NzI0MTYyMTcxNkUtNCUyQzMuMjU2ODc0NTg5MjI3NjU4NUUtNCUyQzQuMDgyOTcwODUxMTA5NjY0RS00JTJDMC4zMzQ2NDQzMjY3ODcyNjk3NCUyQzUuNDY3OTAzNTAxMzE4NzU5RS00JTJDMC4yNjc3MTk1MTQzOTI1NTM3JTVEJTJDTGlzdEJ1ZmZlciUyOCUyOCUyODYuMjI2MTQ3NDgwNTM2MjUzJTJDMjg5JTI5JTJDMjclMjklMkMlMjAlMjglMjg1Ljk3MTM4NDc3Mjk3NjQzMSUyQzU5NSUyOSUyQzUzJTI5JTJDJTIwJTI4JTI4My4yMTY3NzgwNDcyMzA3MjYlMkM3ODQwJTI5JTJDNTQlMjklMjklMjk=";
int len = str.getBytes().length;
System.out.println("1.按操作系統默認編碼來編碼:" + len);
len = str.getBytes("GBK").length;
System.out.println("2.GBK編碼的字節數:"+ len);
len = str.getBytes("UTF-8").length;
System.out.println("3.UTF-8編碼的字節數:" + len);
len = str.getBytes("Unicode").length;
System.out.println("4.Unicode編碼的字節數:" + len);
/*
* 當前編碼:UTF-8
* 1.按操作系統默認編碼來編碼:5
* 2.GBK編碼的字節數:4
* 3.UTF-8編碼的字節數:5
* 4.Unicode編碼的字節數:8
*/
} catch ( java.io.UnsupportedEncodingException e) {
System.out.println(e.getMessage().toString());
}
}
}
另外博主收藏這些年來看過或者聽過的一些不錯的常用的上千本書籍,沒準你想找的書就在這裏呢,包含了互聯網行業大多數書籍和麪試經驗題目等等。有人工智能系列(常用深度學習框架TensorFlow、pytorch、keras。NLP、機器學習,深度學習等等),大數據系列(Spark,Hadoop,Scala,kafka等),程序員必修系列(C、C++、java、數據結構、linux,設計模式、數據庫等等)以下是部分截圖
更多文章見本原創微信公衆號「五角錢的程序員」,我們一起成長,一起學習。一直純真着,善良着,溫情地熱愛生活。關注回覆【電子書】即可領取哦。
給大家推薦一個Github,上面非常非常多的乾貨:https://github.com/XiangLinPro/IT_book
Promise yourself to accept life as it comes
and truly make each day special.