coding--字符編碼簡單理解

Ascii編碼:單字節編碼;

Gb2312編碼:用於漢字編碼,雙字節,一個表示區碼,一個表示位碼;

GBK編碼:ASCII編碼和GB2312的合集;

GB18030編碼:GBK的超集,兼容GBK,變長,124字節;

Unicode(統一碼、萬國碼、單一碼)爲每種語言中的每個字符設定了統一併且唯一的二進制編碼,每個字符的二進制值從單個字節到4個字節,爲方便unicode存儲,出現UTF-8、UTF-16、UTF-32編碼。

UTF-8編碼:unicode的實現方法,每個字符自動選擇編碼長度的表示方法,對於單字節的符號,字節的第一位設爲0,後面7位爲這個符號的unicode碼。因此對於英語字母,UTF-8編碼和ASCII碼是相同的。對於n字節的符號(n>1),第一個字節的前n位都設爲1,第n+1位設爲0,後面字節的前兩位一律設爲10。剩下的沒有提及的二進制位,全部爲這個符號的unicode碼。

BASE64編碼:採用64個基本的ASCII碼字符對數據進行重新編碼,將3個字節編碼爲4個字節,編碼後方便網絡傳輸,BASE64的源碼可以是任意碼流,跟前面的字符編碼沒有直接關係。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章