Python爬蟲:Cookie和session模擬登陸

Cookie和session模擬登陸:

1.適用網站類型:爬取網站頁面需要登陸才能訪問,否則獲取不到頁面的實際響應數據
方法一:(利用cookie)
  • 1.先登陸成功一次,獲取到攜帶登陸信息的Cookie
  • 2.利用處理的headers向url地址發請求
方法二:(利用session會話保持)(先post,再get)
  • 1.F12或者查看源代碼,找post地址:form表單->action對應地址的登陸地址,以字典方式發送用戶名和密碼信息到post地址
  • 2.定義字典(用戶名和密碼),創建session實例發送請求
data_dict ={'用戶名參數':'yonghuming','密碼的參數':'mima'}
session = requests.session()
session.post(url=action登陸地址,date=用戶名密碼字典,headers= headers)
  • 3.get頁面信息
res = session.get(url=請求頁面信息地址,headers=headers).text
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章