字符集與編碼

字符集和字符編碼是兩個不同的概念。
字符集顧名思義是“許多字符的集合”,字符編碼是對這些集合的編碼方式。比如’a’在ASCII碼中的編碼是0110 0001。

1、ASCII碼(即是字符集也是編碼)
英語字符——二級制位
字符集是:英語字符
編碼:7位二進制

2、擴展ASCII碼(即是字符集也是編碼)
其他字符——二級制位
字符集:英語字符+其他字符
編碼:8位二進制

3、ANSI編碼(即是字符集也是編碼)
GB2312、BIG5、JIS

4、Unicode(字符集)
將世界上絕大多數國家的文字、符號都編入其字符集,它爲每種語言中的每個字符設定了統一併且唯一的二進制編碼,以滿足跨語言、跨平臺進行文本轉換、處理的要求。
注意其字節序

5、UTF(編碼方式)----是對Unicode的編碼方式
UTF-16:16位表示一個字符
UTF-32:32位表示一個字符
UTF-8:使用可變長度字節儲存Unicode。例如 ASCII 字母繼續使用 1 字節儲存,重音文字、希臘字母或西裏爾字母等使用 2 字節來儲存,而常用的漢字就要使用 3 字節。輔助平面字符則使用 4 字節。UTF-8 更便於在使用 Unicode 的系統與現存的單字節的系統進行數據傳輸和交換。
與前兩個方案不同:UTF-8 以字節爲編碼單元,沒有字節序的問題。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章