[Java 基礎]客戶端,服務器編碼理論基礎

一、常見的編碼集。

ISO8859-1:最爲古老的編碼,計算機初期出現即使用的編碼集。引文字母,數字以及常見的可見字符。一個字節兩個字符去單獨編碼。

GB2312:計算機引入中國後,將ISO8859-1拓展的,包括最爲基本的2312個漢字的編碼,兩個字節單獨編碼。

     -----GBK編碼:由GB2312延拓的編碼集。仍然兩個字節單獨編碼。

UNICODE:因爲全世界語言文字使用不一,爲了統一而進行編碼的編碼集。

           並不兼容GB2312或者GBK編碼或者其他的編碼,只是在兼容ISO8859-1的基礎上對世界上所有可見字符做出的編碼。

     -----UTF-8:由UNICODE拓展而來,3個字節單獨編碼。

 

二、URL編碼

爲了解決HTTP協議只支持ISO8859-1編碼,不能支持中文的問題,使用URL編碼解決問題。

比方說:在頁面中使用GET請求方式,攜帶參數“中國”,編碼方式GB2312或者GBK

將單個的中文字符(兩個字符8個二進制文字)以字節方式展現(“中”:0101 1010 1010 0010),這樣,得到其GB2312編碼的底層編碼;

‚傳遞到瀏覽器,使用URL編碼,將底層的二進制文字進行16進制進行編碼(“中”:2c 3d)這樣比方說,然後在每個字符前面加上“%”。

ƒ從而保證了中文字符的可達性。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章