字符编码浅析

  • ASCII (American Standard Code for Information Interchange) 美国信息交换标准代码
    ASCII是一种单字节字符编码方案,即使用1 byte(字节)= 8 bit(比特位)来表示一个字符。一个字节能表示的最大的整数就是255(二进制 11111111 = 十进制 255),0 - 255被用来表示大小写英文字母、数字和一些符号。但是要表示中文,显然一个字符是不够存储的,于是中国制定了GB2312编码,世界各国也都有自己的标准编码,这样就容易产生冲突和乱码,因此Unicode应运而生。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了
  • Unicode 统一码
    Unicode通常用两个字节表示一个字符,将原有的英文编码从单字节变成双字节。如果表示ASCII编码中的英文字符只需要把高字节全部填为0就可以,因此解决了字符乱码问题。但产生的新问题是,如果仅表示英文字符,用Unicode编码比ASCII编码需要多一倍的存储空间,在存储和传输上就十分不划算。所以,本着节约的精神,又出现了针对把Unicode编码转化为“可变长编码”的UTF-8编码。
  • UTF-8 (8-bit Unicode Transformation Format) 针对Unicode的可变长度字符编码
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章