爬蟲cookie處理的2種方式

通過cookies我們可以實現登錄一次後免登錄
我直接貼代碼,username和password需要根據網站情況分辨

import urllib.request
import urllib.parse
import http.cookiejar
url=""
postdata=urllib.parse.urlencode({
    "username":"lihang",
    "passward":"123456"
}).encode("utf-8")
req=urllib.request.Request(url,postdata)
req.add_header("")
#創建cookie處理器
cjar=http.cookiejar.CookieJar()
opener=urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cjar))
#全局安裝cookie
urllib.request.install_opener(opener)


第二種是Request庫的,這個庫不虧很方便,下次使用的時候把cookiejar放進去即可
cookies={‘PHPSESSID’: ‘cnguud4r1hmn3passs906odp21’}#這裏就是利用上面的函數獲得的Cookies
requests.get(url,headers=headers,cookies=cookies,verify=False)即可

import requests
response = requests.get("http://www.baidu.com/")
#返回CookieJar對象:
cookiejar = response.cookies
#  將CookieJar轉爲字典:
cookiedict = requests.utils.dict_from_cookiejar(cookiejar)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章