python爬蟲通用框架

import requests


def getHTMLText(url):

try:

r = requests.get(url,timeout=30)

r.raise_for_status()  # 如果狀態不是200,引發HTTP-Error異常

#print(r.status_code)

r.encoding = r.apparent_encoding

return r.text

except:

return "產生異常"


if __name__=="__main__":

url = "https://item.jd.com/5107323.html"

print(getHTMLText(url))


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章