python 在處理網頁的時候通常需要自己構造url,如在瀏覽器中顯示爲
實際瀏覽器載入的url是:
http://search.jd.com/Search?keyword=%E7%A7%BB%E5%8A%A8%E5%B8%A6%E5%BC%8F%E8%BE%93%E9%80%81%E6%9C%BA&enc=utf-8&book=y
這裏涉及到url編碼中文的問題
需要把中文轉換爲url編碼,具體用到python urllib或者urllib2庫,一下用urllib2實例
isn=raw_input('請輸入關鍵字')
isn1=urllib2.quote(isn.decode(sys.stdin.encoding).encode('utf8'))
url='http://search.jd.com/Search?keyword='+isn1+'&enc=utf-8&suggest=0&book=y'
具體紅色部分用什麼編碼方式的具體分析,像京東的是utf8方式從url中也可以體現出來。百度的是gbk,其他的一般網站比如google就是utf8的。
參考鏈接:http://developer.51cto.com/art/201003/190800.htm