URLEncode與Java中的URLEncode

urlencode

在1994年訂立的RFC1738中。對字符串中除了-_.三個字符之外的所有非字母數字字符都替換成百分號(%)後跟兩位十六進制數。十六進制數中字母必須爲大寫。
http://tools.ietf.org/html/rfc1738

在2005年定義的RFC3986中,將針對- _.~(擴充了一個波浪線字符)四個字符之外的所有非字母數字字符進行百分號編碼。

http中的urlencode

在W3C找到HTML標準的說明 http://www.w3.org/TR/REC-html40/interact/forms.html#h-17.13.4
在這裏清楚的看到編碼方式是根據ContextType的不同而區別對待的,在form的ContextType是[x-www-form-urlencoded]的時候會對form中的鍵/值對進行編碼,空格被轉義成+,其他字符按照[RFC1738]標準處理成%HH的形式。

編程語言中urlencode的實現

java

在這裏插入圖片描述
java中的UrlEncode是實現http協議form表單的標準,因此把空格轉換成+,而沒有提供類似php中rawurlencode的實現(RFC1738標準)

php

在php當中也提供了標準的RFC1738的實現
在PHP Manual中有對兩個函數的說明:

urlencode:返回字符串,此字符串中除了 - _ . 之外的所有非字母數字字符都將被替換成百分號(%)後跟兩位十六進制數,空格則編碼爲加號(+)。此編碼與 WWW 表單 POST 數據的編碼方式是一樣的,同時與 application/x-www-form-urlencoded 的媒體類型編碼方式一樣。由於歷史原因,此編碼在將空格編碼爲加號(+)方面與 RFC1738 編碼(參見 rawurlencode())不同。

rawurlencode:返回字符串,此字符串中除了 - _ . 之外的所有非字母數字字符都將被替換成百分號(%)後跟兩位十六進制數。這是在 RFC 1738 中描述的編碼,是爲了保護原義字符以免其被解釋爲特殊的 URL 定界符,同時保護 URL 格式以免其被傳輸媒體(像一些郵件系統)使用字符轉換時弄亂。

http服務器支持

get請求query string或者form表單post提交時,客戶端默認會進行urlencode,http服務器獲取請求參數或者表單內容時默認進行urldecode。因此如果參數中含有空格或者加號時如果一端手動進行urlencode時,另一端要手動進行urldecode

例如,使用postman發送form表單提交(x-www-form-urlencoded),

原始參數:
app_id:123
sign:g952eLOp/zY942ACbtuaJk1L57W+OOh1A5rGJJzigX6y95dJ BjA020lIoxyHW62jU=
在這裏插入圖片描述

post body體的格式
app_id=123&sign=g952eLOp%2FzY942ACbtuaJk1L57W%2BOOh1A5rGJJzigX6y95dJ+BjA020lIoxyHW62jU%3D
在這裏插入圖片描述

/ 轉換成 %2F
+ 轉換成 %2B
空格 轉換成 +
= 轉換成 %3D

在這裏插入圖片描述
controller層已經是urldecode後的數據了

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章