ASCII、Unicode、UTF-8区别

 

ASCII——(美国)最早只有127个字母被编码到计算机里,也就是大小写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比如大写字母A的编码是65,小写字母z的编码是122。

ANSI——ASCII不能够很好的容纳自己的语言,所以不同的国家在ASCII基础上提出自己的语言编码,这些编码统称为ANSI 编码。在不同的系统下,相同的ANSI 编码代表不同的文字,比如GB2312(简体中文)、GBK(简繁体)

Unicode——ANSI 编码在不同的编码体系里代表着不同的字,各个国家的ANSI也不一样,这样就需要统一编码。Unicode编码采用4个字节长度,将上述编码都统一起来。(这就意味着一个英文字符本来只需要1个字节,而在Unicode编码体系下需要4个字节,其余3个字节为空。这就导致资源的浪费)

UTF-8——解决Unicode带来的资源浪费,变长的字节码,可以理解成 压缩Unicode

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章