Cookie和session模擬登陸:
1.適用網站類型:爬取網站頁面需要登陸才能訪問,否則獲取不到頁面的實際響應數據
方法一:(利用cookie)
- 1.先登陸成功一次,獲取到攜帶登陸信息的Cookie
- 2.利用處理的headers向url地址發請求
方法二:(利用session會話保持)(先post,再get)
- 1.F12或者查看源代碼,找post地址:form表單->action對應地址的登陸地址,以字典方式發送用戶名和密碼信息到post地址
- 2.定義字典(用戶名和密碼),創建session實例發送請求
data_dict ={'用戶名參數':'yonghuming','密碼的參數':'mima'}
session = requests.session()
session.post(url=action登陸地址,date=用戶名密碼字典,headers= headers)
- 3.get頁面信息
res = session.get(url=請求頁面信息地址,headers=headers).text