一、常见的编码集。
ISO8859-1:最为古老的编码,计算机初期出现即使用的编码集。引文字母,数字以及常见的可见字符。一个字节两个字符去单独编码。
GB2312:计算机引入中国后,将ISO8859-1拓展的,包括最为基本的2312个汉字的编码,两个字节单独编码。
-----GBK编码:由GB2312延拓的编码集。仍然两个字节单独编码。
UNICODE:因为全世界语言文字使用不一,为了统一而进行编码的编码集。
并不兼容GB2312或者GBK编码或者其他的编码,只是在兼容ISO8859-1的基础上对世界上所有可见字符做出的编码。
-----UTF-8:由UNICODE拓展而来,3个字节单独编码。
二、URL编码
为了解决HTTP协议只支持ISO8859-1编码,不能支持中文的问题,使用URL编码解决问题。
比方说:在页面中使用GET请求方式,携带参数“中国”,编码方式GB2312或者GBK
将单个的中文字符(两个字符8个二进制文字)以字节方式展现(“中”:0101 1010 1010 0010),这样,得到其GB2312编码的底层编码;
‚传递到浏览器,使用URL编码,将底层的二进制文字进行16进制进行编码(“中”:2c 3d)这样比方说,然后在每个字符前面加上“%”。
ƒ从而保证了中文字符的可达性。