Python爬蟲5.7 — scrapy框架Shell命令的使用

Python爬蟲5.7 — scrapy框架Shell命令的使用

綜述

本系列文檔用於對Python爬蟲技術的學習進行簡單的教程講解,鞏固自己技術知識的同時,萬一一不小心又正好對你有用那就更好了。
Python 版本是3.7.4

本篇文章主要講解Scrapy Shall的使用。

Scrapy Shall

我們想要再爬蟲中使用xpath、beautifulsoup、正則表達式、css選擇器等來提取想要的數據。但是因爲Scrapy是一個比較重的框架,每次運行起來都要等待一段時間,因此要去驗證我們寫的提取規則是否正確,是一個比較麻煩的事情。因此Scrapy提供了一個shell,用來方便的測試規則,當然也不僅僅侷限於這一功能。

打開Scrapy Shall

打開cmd終端,進入到Scrapy項目所在的目錄,然後進入到Scrapy框架所在的虛擬環境中(有的人直接使用本地環境也是可以的),輸入命令

scrapy shell [鏈接]

就會進入到scrapy的shell環境中,你可以跟在爬蟲的parse方法中一樣的使用了。

總結

  1. 可以方便我們做一些數據提取的測試代碼。
  2. 如果想要執行scrapy命令,那麼毫無疑問,肯定要先進入到scrapy所在的環境中。
  3. 如果想要讀取某個項目的配置信息,那麼應該進入到這個項目中。再執行scrapy shell命令。

其他博文鏈接

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章