python 根據中文構造url的方法

python 在處理網頁的時候通常需要自己構造url,如在瀏覽器中顯示爲wKioL1L523DCRZCeAAA8urpzF6w821.jpg

實際瀏覽器載入的url是:

http://search.jd.com/Search?keyword=%E7%A7%BB%E5%8A%A8%E5%B8%A6%E5%BC%8F%E8%BE%93%E9%80%81%E6%9C%BA&enc=utf-8&book=y

這裏涉及到url編碼中文的問題


需要把中文轉換爲url編碼,具體用到python urllib或者urllib2庫,一下用urllib2實例

isn=raw_input('請輸入關鍵字')

isn1=urllib2.quote(isn.decode(sys.stdin.encoding).encode('utf8'))

url='http://search.jd.com/Search?keyword='+isn1+'&enc=utf-8&suggest=0&book=y'


具體紅色部分用什麼編碼方式的具體分析,像京東的是utf8方式從url中也可以體現出來。百度的是gbk,其他的一般網站比如google就是utf8的。



參考鏈接:http://developer.51cto.com/art/201003/190800.htm



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章