Unicode,ASCII,UTF-8,GBK

ASCII碼:

上個世紀60年代,美國製定了一套字符編碼,對英語字符與二進制位之間的關係,做了統一規定。這被稱爲ASCII碼。ASCII碼一共規定了128個字符的編碼。但是ASCII碼不能表示所有字符。


亂碼:世界上存在着多種編碼方式,同一個二進制數字可以被解釋成不同的符號。因此,要想打開一個文本文件,就必須知道它的編碼方式,否則用錯誤的編碼方式解讀,就會出現亂碼。

Unicode:一種編碼,將世界上所有的符號都納入其中。每一個符號都給予一個獨一無二的編碼,使用 Unicode 沒有亂碼的問題。


但是Unicode 只是一個符號集,它只規定了符號的二進制代碼,卻沒有規定這個二進制代碼應該如何存儲:無法區別 Unicode 和 ASCII:計算機無法區分三個字節表示一個符號還是分別表示三個符號。


UTF-8 是在互聯網上使用最廣的一種 Unicode 的實現方式。

GBK包含全部中文字符;UTF-8則包含全世界所有國家需要用到的字符。GBK是在國家標準GB2312基礎上擴容後兼容GB2312的標準(爲漢字而創建的)

UTF-8編碼的文字可以在各國各種支持UTF8字符集的瀏覽器上顯示。
比如,如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,而無需他們下載IE的中文語言支持包

UTF8是國際編碼,它的通用性比較好,外國人也可以瀏覽論壇,GBK是國家編碼,通用性比UTF8差

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章