关于python请求url报HTTP Error 400: Bad Request

使用的python模块urllib2,函数模块
def solrRequest(self,url):
context = None
try:
context = urllib2.urlopen(url).read()
except Exception,e:
context = None
print e
return context
原报错url:’http://XX.XX.XX.XX:8080/aaa/bbb/ccc/ddd?eee.fff=\xe9\xa9\xac\xe5\xb0\x94\xe4\xbb\xa3\xe5\xa4\xab&analysis.fieldname=address&verbose_output=0&wt=json&indent=true’
出错原因:\xe9\xa9\xac\xe5\xb0\x94\xe4\xbb\xa3\xe5\xa4\xab
出错分析:改格式编码是中文的“马尔代夫”UTF-8编码格式,但是直接通过solrRequest方法时报错无法正确解析
解决方法:
第一种:
urllib2.quote(\xe9\xa9\xac\xe5\xb0\x94\xe4\xbb\xa3\xe5\xa4\xab)
或者:url = urllib2.quote(url,’:/=&?’) #除了‘:/=&?’字符外其他都进行解析
可以正常解析的url:’http://XX.XX.XX.XX:8080/aaa/bbb/ccc/ddd?eee.fff=%E9%A9%AC%E5%B0%94%E4%BB%A3%E5%A4%AB&analysis.fieldname=address&verbose_output=0&wt=json&indent=true

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章