[Java 基础]客户端,服务器编码理论基础

一、常见的编码集。

ISO8859-1:最为古老的编码,计算机初期出现即使用的编码集。引文字母,数字以及常见的可见字符。一个字节两个字符去单独编码。

GB2312:计算机引入中国后,将ISO8859-1拓展的,包括最为基本的2312个汉字的编码,两个字节单独编码。

     -----GBK编码:由GB2312延拓的编码集。仍然两个字节单独编码。

UNICODE:因为全世界语言文字使用不一,为了统一而进行编码的编码集。

           并不兼容GB2312或者GBK编码或者其他的编码,只是在兼容ISO8859-1的基础上对世界上所有可见字符做出的编码。

     -----UTF-8:由UNICODE拓展而来,3个字节单独编码。

 

二、URL编码

为了解决HTTP协议只支持ISO8859-1编码,不能支持中文的问题,使用URL编码解决问题。

比方说:在页面中使用GET请求方式,携带参数“中国”,编码方式GB2312或者GBK

将单个的中文字符(两个字符8个二进制文字)以字节方式展现(“中”:0101 1010 1010 0010),这样,得到其GB2312编码的底层编码;

‚传递到浏览器,使用URL编码,将底层的二进制文字进行16进制进行编码(“中”:2c 3d)这样比方说,然后在每个字符前面加上“%”。

ƒ从而保证了中文字符的可达性。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章