Pycharm+Scrapy安裝並且初始化項目

前言

Scrapy是一個開源的網絡爬蟲框架,Python編寫的。最初設計用於網頁抓取,也可以用來提取數據使用API或作爲一個通用的網絡爬蟲。是數據採集不可必備的利器。

安裝

pip install scrapy 

如果使用上面的命令太慢。國內可以使用豆瓣源進行加速。

pip install -i  https://pypi.douban.com/simple scrapy 

注意要寫錯了,是 https://pypi.douban.com/simple 很多包都可以使用這個源進行加速,這也是pip的一個技巧,還可以使用阿里雲進行加速。

安裝完成之後在命令行輸入

scrapy -v

如果出現了相應的版本號就說明安裝成功。

創建項目

目前還沒有IDE 能夠創建scrapy的項目,我們必須手動初始化項目。
1、找一個目錄
輸入命令

scrapy startproject SpiderObject

命令行出現這樣的結果說明創建成果

You can start your first spider with:
    cd SpiderObject
    scrapy genspider example example.com

去文件夾中看看
這裏寫圖片描述

初始化項目

使用pycharm打開該項目
這裏寫圖片描述
如果出現這個頁面就說明對了。
這裏寫圖片描述
下面生成一個模板
打開pycharm的terminal
這裏寫圖片描述

輸入

scrapy genspider BiduSpider http://www.baidu.com

我們的spider 包下面會多一個文件
這裏寫圖片描述

這說明我們的spider創建成功。可以在pytharm中使用這個 強大的框架了。

發佈了47 篇原創文章 · 獲贊 80 · 訪問量 24萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章