字符編碼淺析

  • ASCII (American Standard Code for Information Interchange) 美國信息交換標準代碼
    ASCII是一種單字節字符編碼方案,即使用1 byte(字節)= 8 bit(比特位)來表示一個字符。一個字節能表示的最大的整數就是255(二進制 11111111 = 十進制 255),0 - 255被用來表示大小寫英文字母、數字和一些符號。但是要表示中文,顯然一個字符是不夠存儲的,於是中國製定了GB2312編碼,世界各國也都有自己的標準編碼,這樣就容易產生衝突和亂碼,因此Unicode應運而生。Unicode把所有語言都統一到一套編碼裏,這樣就不會再有亂碼問題了
  • Unicode 統一碼
    Unicode通常用兩個字節表示一個字符,將原有的英文編碼從單字節變成雙字節。如果表示ASCII編碼中的英文字符只需要把高字節全部填爲0就可以,因此解決了字符亂碼問題。但產生的新問題是,如果僅表示英文字符,用Unicode編碼比ASCII編碼需要多一倍的存儲空間,在存儲和傳輸上就十分不划算。所以,本着節約的精神,又出現了針對把Unicode編碼轉化爲“可變長編碼”的UTF-8編碼。
  • UTF-8 (8-bit Unicode Transformation Format) 針對Unicode的可變長度字符編碼
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章