- ASCII (American Standard Code for Information Interchange) 美國信息交換標準代碼
ASCII
是一種單字節字符編碼方案,即使用1 byte(字節)= 8 bit(比特位)來表示一個字符。一個字節能表示的最大的整數就是255(二進制11111111
= 十進制255
),0 - 255被用來表示大小寫英文字母、數字和一些符號。但是要表示中文,顯然一個字符是不夠存儲的,於是中國製定了GB2312
編碼,世界各國也都有自己的標準編碼,這樣就容易產生衝突和亂碼,因此Unicode
應運而生。Unicode
把所有語言都統一到一套編碼裏,這樣就不會再有亂碼問題了 - Unicode 統一碼
Unicode
通常用兩個字節表示一個字符,將原有的英文編碼從單字節變成雙字節。如果表示ASCII
編碼中的英文字符只需要把高字節全部填爲0就可以,因此解決了字符亂碼問題。但產生的新問題是,如果僅表示英文字符,用Unicode
編碼比ASCII
編碼需要多一倍的存儲空間,在存儲和傳輸上就十分不划算。所以,本着節約的精神,又出現了針對把Unicode
編碼轉化爲“可變長編碼”的UTF-8
編碼。 - UTF-8 (8-bit Unicode Transformation Format) 針對Unicode的可變長度字符編碼
字符編碼淺析
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.