一、常見的編碼集。
ISO8859-1:最爲古老的編碼,計算機初期出現即使用的編碼集。引文字母,數字以及常見的可見字符。一個字節兩個字符去單獨編碼。
GB2312:計算機引入中國後,將ISO8859-1拓展的,包括最爲基本的2312個漢字的編碼,兩個字節單獨編碼。
-----GBK編碼:由GB2312延拓的編碼集。仍然兩個字節單獨編碼。
UNICODE:因爲全世界語言文字使用不一,爲了統一而進行編碼的編碼集。
並不兼容GB2312或者GBK編碼或者其他的編碼,只是在兼容ISO8859-1的基礎上對世界上所有可見字符做出的編碼。
-----UTF-8:由UNICODE拓展而來,3個字節單獨編碼。
二、URL編碼
爲了解決HTTP協議只支持ISO8859-1編碼,不能支持中文的問題,使用URL編碼解決問題。
比方說:在頁面中使用GET請求方式,攜帶參數“中國”,編碼方式GB2312或者GBK
將單個的中文字符(兩個字符8個二進制文字)以字節方式展現(“中”:0101 1010 1010 0010),這樣,得到其GB2312編碼的底層編碼;
‚傳遞到瀏覽器,使用URL編碼,將底層的二進制文字進行16進制進行編碼(“中”:2c 3d)這樣比方說,然後在每個字符前面加上“%”。
ƒ從而保證了中文字符的可達性。