爬蟲之代理池學習(二)

接上一篇:爬蟲之代理池學習(一)

7、實現數據庫模塊

  • 作用:用於對Proxies集合進行數據庫的相關操作
  • 目標: 實現對數據庫增刪改查相關操作
  • 步驟:
    • 1、在init中, 建立數據連接, 獲取要操作的集合, 在 del 方法中關閉數據庫連接
    • 2、提供基礎的增刪改查功能
      • 實現插入功能
      • 實現修改該功能
      • 實現刪除代理: 根據代理的IP刪除代理
      • 查詢所有代理IP的功能
    • 3、提供代理API模塊使用的功能
      • 實現查詢功能: 根據條件進行查詢, 可以指定查詢數量, 先分數降序, 速度升序排, 保證優質的代理IP在上面.
      • 實現根據協議類型 和 要訪問網站的域名, 獲取代理IP列表
      • 實現根據協議類型 和 要訪問網站的域名, 隨機獲取一個代理IP
      • 實現把指定域名添加到指定IP的disable_domain列表中.

在這裏插入代碼片

8、實現代理IP爬蟲模塊

在這裏插入代碼片

9、實現代理IP檢測模塊

在這裏插入代碼片

10、實現代理IP檢測模塊

在這裏插入代碼片

11、實現代理IP池啓動入口

在這裏插入代碼片
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章