爬蟲

1 url管理器,把獲取的url放進來
2 url內容下載器,下載url列表裏面的內容
3 解析url,用到beautifulsoup,網頁基礎
4 存儲數據

2url獲取
簡單的靜態網頁獲取的基本代碼
rest=requests.get() 獲得一個response對象
print(response.text) 獲得response對象裏面的內容。
https://blog.csdn.net/qq_39241986/article/details/80721717
(1)Get是向服務器發索取數據的一種請求;而Post是向服務器提交數據的一種請求,要提交的數據位
於信息頭後面的實體中。GET和POST只是發送機制不同,並不是一個取一個發.
(2)GET請求時其發送的信息是以url明文發送的,其參數會被保存在瀏覽器歷史或web服務器中,而post則不會某(這也是後面我們翻頁的時候發現拉勾網翻頁時 瀏覽器 url欄地址沒有變化的原因。)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章