會寫爬蟲的大牛們真的瞭解urllib嗎?

說起urllib,我想每個會寫爬蟲或者說聽過爬蟲的人都不陌生,它是爬蟲的基本和常用庫之一,我們今天就來從頭到尾瞭解下。
一、什麼是Urllib
1、Python的內置HTTP請求庫,常用模塊如下
(1)Urllib.request 請求模塊(用來整理和發送請求)
(2)Urllib.error 異常處理模塊
(3)Urllib.parse url解析模塊
(4)Urllib.robotparser robots.txt解析模塊
後面的內容我們再來詳細介紹這幾個模塊的基本用法。
二、Python3相比Python2的變化
其實Python3中的urlopen這個函數方法在Python2中屬於urllib2這個庫,在Python3中移動到了urllib.request這個模塊中,這是最明顯的一個變化,還有其他變化,我們就不一一列舉了。
三、常用模塊的基本用法
1、Urlopen
(1)發送請求給服務器,第一個參數爲網站的url,第二個參數爲額外的數據,也就是post時候的數據,第三個參數超時的設置,具體看下面的示例:
在這裏插入圖片描述
(2)響應response
①響應類型
②狀態碼status獲取
③響應頭getHeaders獲取
④Read方法,獲取響應內容
2、Request:瀏覽器發送消息給網址所在的服

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章