ASCII、Unicode、UTF-8區別

 

ASCII——(美國)最早只有127個字母被編碼到計算機裏,也就是大小寫英文字母、數字和一些符號,這個編碼表被稱爲ASCII編碼,比如大寫字母A的編碼是65,小寫字母z的編碼是122。

ANSI——ASCII不能夠很好的容納自己的語言,所以不同的國家在ASCII基礎上提出自己的語言編碼,這些編碼統稱爲ANSI 編碼。在不同的系統下,相同的ANSI 編碼代表不同的文字,比如GB2312(簡體中文)、GBK(簡繁體)

Unicode——ANSI 編碼在不同的編碼體系裏代表着不同的字,各個國家的ANSI也不一樣,這樣就需要統一編碼。Unicode編碼採用4個字節長度,將上述編碼都統一起來。(這就意味着一個英文字符本來只需要1個字節,而在Unicode編碼體系下需要4個字節,其餘3個字節爲空。這就導致資源的浪費)

UTF-8——解決Unicode帶來的資源浪費,變長的字節碼,可以理解成 壓縮Unicode

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章