Unicode,UTF-8,GB2312編碼的識別

原創

2020-02-25 19:18

在UCS編碼中有一個叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的編碼是FEFF。而FFFE在UCS中是不存在的字符，所以不應該出現在實際傳輸中。UCS規範建議我們在傳輸字節流前，先傳輸字符"ZERO WIDTH NO-BREAK SPACE"。

這樣如果接收者收到FEFF，就表明這個字節流是Big-Endian的；如果收到FFFE，就表明這個字節流是Little-Endian的。因此字符"ZERO WIDTH NO-BREAK SPACE"又被稱作BOM。

UTF-8不需要BOM來表明字節順序，但可以用BOM來表明編碼方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8編碼是EF BB BF（讀者可以用我們前面介紹的編碼方法驗證一下）。所以如果接收者收到以EF BB BF開頭的字節流，就知道這是UTF-8編碼了。

Unicode：FF FE

Unicode big_endian：EF FF

UTF-8： EF BB BF

GB2312是高位在前，Big_endian

下面的方式可以得到字符串內碼

char chs[]=mystr.toCharArray();
StringBuffer sb=new StringBuffer();
for(int i = 0; i < chs.length; i++){
sb.append(chs[i] + " = " + (int)chs[i]+" ");
}
System.out.println(sb.toString());

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

win10-maskrcnn-benchmark使用文檔

文章目錄一、項目簡介二、項目源碼結構三、程序源代碼安裝與使用四、參考（acknowledgement）一、項目簡介本程序源自於facebookresearch/maskrcnn-benchmark，進行相關修改調整並簡化重

2020-06-27 23:01:49

Python安裝、調用擴展模塊（python，c/c++）

目錄安裝Python模塊Python調用C/C++擴展模塊參考資料安裝Python模塊 distutils, setuptools是python標準庫裏邊的工具包，用於安裝擴展模塊。後者是前者的增強版，支持便捷安裝，但大多C/C

2020-06-27 23:01:48

Ubuntu自動更換壁紙

個人博客：http://www.chenjianqu.com/ 原文鏈接：http://www.chenjianqu.com/show-112.html 現在Ubuntu16.04是我的主力系統，因此想用的舒服一點。我個人非常重視壁紙

2020-06-23 08:30:46

最詳細的PCL編譯安裝流程

個人博客：http://www.chenjianqu.com/ 原文鏈接：http://www.chenjianqu.com/show-98.html Ubuntu16.04可以直接使用apt安裝PCL1.7，但是很多情況下我們需

2020-06-23 08:30:46

Leetcode 683. K 個空花盆（滑動窗口或者線段樹）

Leetcode 683. K 個空花盆花園裏有 N 個花盆，每個花盆裏都有一朵花。這 N 朵花會在 N 天內依次開放，每天有且僅有一朵花會開放並且會一直盛開下去。給定一個數組 flowers 包含從 1 到 N 的數字，每個

木子-勇士心

2020-06-21 09:51:55

CCF CSP 編程題目和解答-----試題名稱：窗口-------201403-2

問題描述試題編號： 201403-2 試題名稱：窗口時間限制： 1.0s 內存限制： 256.0MB 問題描述：問題描述　　在某圖形操作系統中,有 N 個窗口,每個窗口都是一個兩邊與座標軸分別平行的矩形區

木子-勇士心

2020-06-21 09:08:24

CCF CSP 編程題目和解答-----試題名稱：畫圖 -------201512-3

問題描述試題編號： 201512-3 試題名稱：畫圖時間限制： 1.0s 內存限制： 256.0MB 問題描述：問題描述　　用 ASCII 字符來畫圖是一件有趣的事情，並形成了一門被稱爲 ASCII Ar

木子-勇士心

2020-06-21 09:08:24

CCF CSP 編程題目和解答-----試題名稱：日期計算-------201509-2

問題描述試題編號： 201509-2 試題名稱：日期計算時間限制： 1.0s 內存限制： 256.0MB 問題描述：問題描述　　給定一個年份y和一個整數d，問這一年的第d天是幾月幾日？　　注意閏年的2月

木子-勇士心

2020-06-21 09:08:24

CCF CSP 編程題目和解答-----試題名稱：爐石傳說 -------201609-3

問題描述試題編號： 201609-3 試題名稱：爐石傳說時間限制： 1.0s 內存限制： 256.0MB 問題描述：問題描述　　《爐石傳說：魔獸英雄傳》（Hearthstone: Heroes of Wa

木子-勇士心

2020-06-21 09:08:23

LintCode 排序列表轉換爲二分查找樹

排序列表轉換爲二分查找樹描述筆記數據評測給出一個所有元素以升序排序的單鏈表，將它轉換成一棵高度平衡的二分查找樹您在真實的面試中是否遇到過這個題？ Yes 樣例

木子-勇士心

2020-06-21 09:08:23

LintCode 二叉樹的序列化和反序列化題解

二叉樹的序列化和反序列化描述筆記數據評測設計一個算法，並編寫代碼來序列化和反序列化二叉樹。將樹寫入一個文件被稱爲“序列化”，讀取文件後重建同樣的二叉樹被稱爲“反序列化”。如何反序列化或序列化二

木子-勇士心

2020-06-21 09:08:23

LintCode 數字組合題解

數字組合描述筆記數據評測給出一組候選數字(C)和目標數字(T),找到C中所有的組合，使找出的數字和爲T。C中的數字可以無限制重複被選取。例如,給出候選數組[2,3,6,7]和目標數字7，所求的解爲：

木子-勇士心

2020-06-21 09:08:23

CCF CSP 編程題目和解答-----試題名稱：路徑解析 -------201604-3

問題描述試題編號： 201604-3 試題名稱：路徑解析時間限制： 1.0s 內存限制： 256.0MB 問題描述：問題描述　　在操作系統中，數據通常以文件的形式存儲在文件系統中。文件系統一般採用層次化的

木子-勇士心

2020-06-21 09:08:23

CCF CSP 編程題目和解答-----試題名稱：Z字形掃描-------201412-2

問題描述試題編號： 201412-2 試題名稱： Z字形掃描時間限制： 2.0s 內存限制： 256.0MB 問題描述：問題描述　　在圖像編碼的算法中，需要將一個給定的方形矩陣進行Z字形掃描(Zigzag

木子-勇士心

2020-06-21 09:08:23

CCF CSP 編程題目和解答-----試題名稱：畫圖-------201409-2

問題描述試題編號： 201409-2 試題名稱：畫圖時間限制： 1.0s 內存限制： 256.0MB 問題描述：問題描述　　在一個定義了直角座標系的紙上，畫一個(x1,y1)到(x2,y2)的矩形指將橫座

木子-勇士心

2020-06-21 09:08:23

24小時熱門文章

最新文章

最新評論文章