python爬蟲基本命令

import  requests             #導入requests包 

requests的基本方法 

r=requests.get('http://www.baidu.com')   #發送request請求,返回response
r.status_code     #檢查http請求返回的狀態,200即成功
r.text            #http響應內容的字符串形式,即url對應頁面的內容
r.encoding        #從http header中猜測的響應內容編碼方式
r.apparent_encoding   #從內容分析出的響應內容編碼方式(備選編碼方式)
r.content         #http響應內容的二進制形式

requests 異常處理方法

requests.ConnectionError      #網絡連接錯誤異常,DNS查詢失敗,拒絕連接
requests.HTTPError            #HTTP錯誤異常
requests.URLRequired          #URL缺失異常
requests.TooManyRedirects     #超過最大重定向次數,產生重定向異常
requests.ConnectTimeout       #連接遠程服務器超時異常
requests.Timeout              #請求URL超時,產生超時異常    (整個過程,包括返回信息)
r.raise_for_status()          #如果不是200,產生requests.HTTPError

requests庫的七個主要方法

requests.request()            #構造一個請求,支撐以下方法的基礎
requests.get()                #獲取HTML網頁的主要方法,對應HTTP的GET
requests.head()               #獲取HTML網頁頭信息的方法,對應於HTTP的head
requests.post()               #向HTML提交POST請求,對應HTML中的POST
requests.put()                #向HTML提交PUT請求,對應HTML中的PUT
requests.patch()              #向HTML網頁提交局部修改請求,對應HTTP的PATCH
requests.delete()             #向HTML頁面提交刪除請求,對應於HTTP的DELETE
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章