ASCII、Unicode和UTF-8

原創

2018-08-22 15:42

拜读
阮一峰关于ASCII、Unicode和utf-8的关系
加上各种查询内容，决定把个人的理解记录下来
Ascii：**
Ascii是一种英文的编码方式，采用一个字节，一个字节8个bit，最左边一位为空，所以用7个bit位表示数据，共计128个子元，其中33个字元无法显示。

ASCII的局限在于只能显示26个基本拉丁字母、阿拉伯数目字和英式标点符号，因此只能用于显示现代美国英语（而且在处理英语当中的外来词如naïve、café、élite等等时，所有重音符号都不得不去掉，即使这样做会违反拼写规则）

Unicode：
随着时代的发展，ASCII越来越不适应互联网的要求，于是出现了Unicode格式，它是把世界上所有的语言字符都进行统计，每个赋予它相应的编码格式，因此一般用到四个字节以上，Unicode至今仍在不断增修，每个新版本都加入更多新的字符。目前最新的版本为2014年6月16日公布的7.0.0[1]，已收入超过十万个字符（第十万个字符在2005年获采纳）

Unicode只是一种编码方式，并没有对如何存储进行了说明

UTF-8：
这是一种基于Unicode格式的编码方式，它是对ascii和Unicode的调和，既满足了英文国家对编码方式的简化，也满足非英文国家对字符的编码，主要体现为，对ascii码可以用一个字节进行编码，保证了对ascii的支持；对非英文字符，通过变长的编码形式编码，保证了对其的支持。

以上只是个人的理解，如想看具体编码的详细信息请参考

阮一峰关于ASCII、Unicode和utf-8的关系

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

ASCII、Unicode和UTF-8

诈骗（杀猪盘）网站进行渗透测试

Python 潮流周刊#50：我最喜欢的 Python 3.13 新特性！

外行也能读懂的网络硬件设备功能原理速成

學習之個人總結

學習python的一些筆記

c++指針再學習

python爬圖片的一個實例

ASCII、Unicode和UTF-8

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結