python爬取網站數據,如何繞過反爬蟲策略

1、使用session對象

session = requests.session()
strhtml = session.get(url) #與當前網站的首次會話

2、設置headers

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) "
                         "Chrome/69.0.3497.100 Safari/537.36",
           "Accept": "application/json"}
session.headers = headers

3、設置cookies

設置與網站首次會話時的cookies爲默認的cookies

cookies = session.cookies
session.headers.setdefault('cookies', cookies)

此後,可以複用之前會話中的cookies了

strhtml2 = session.get(url2)


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章