在windows下如何新建爬蟲虛擬環境和進行scrapy安裝

Scrapy是Python開發的一個快速、高層次的屏幕抓取和web抓取框架,用於抓取web站點並從頁面中提取結構化的數據。Scrapy吸引人的地方在於它是一個框架,任何人都可以根據需求方便的修改。Scrapy用途廣泛,可以用於數據挖掘、監測和自動化測試。

1、關於虛擬環境的創建可以參考之前發佈的兩篇博文,在Windows下如何創建指定的虛擬環境在Windows下如何創建虛擬環境(默認情況下)。下面在指定的文件夾下,直接先創建環境,在命令行輸入環境創建命令“virtualenv --python=C:Python34python.exe scrapy_demo”,指定Python的版本和路徑,以及虛擬環境的名字scrapy_demo,其中虛擬環境可以自己進行修改,這裏命名爲scrapy_demo。



2、爾後進入到scrapy_demo文件夾下,找到Scripts文件夾,輸入activate.bat以激活虛擬環境,步驟如下圖所示。之後可以看到scrapy_demo被括號括起來了,說明進入了環境,在命令行中輸入python,可以看到直接彈出Python3的環境。

3、新建完虛擬環境之後,接下來就開始安裝Scrapy,輸入安裝命令“pip install Scrapy”或者“pip install -i pypi.douban.com/simple/ Scrapy”,後面這個命令是通過豆瓣源鏡像進行下載,速度會快很多,而且較爲穩定,建議使用該方法進行安裝,Python中的其他庫也建議用該命令進行安裝,十分的方便快捷。輸入命令之後,等待Scrapy的安裝,如下圖所示。

4、可以看到Scrapy的安裝速度非常快,因爲我們使用了鏡像進行下載。不過稍等片刻之後可能會碰到timeout的問題,這是由於Scrapy安裝的過程中需要很多依賴包,導致下載過程中會遇到網絡延時的問題,此時只需要重新輸入安裝命令進行安裝即可。除了timeout的問題之外,可能還會碰到下圖這個問題。

5、這個問題的出現是因爲缺乏Twisted依賴包,此時通過“pip install twisted”可能有問題,這裏給大家介紹一個非常實用的Python包網站lfd.uci.edu/~gohlke/pyt,裏邊的Python包專門用於Windows下的安裝的。在網頁中找到Twisted安裝包,然後選擇本機Python對應版本和電腦系統位數的安裝包,小編的電腦是64位的,而且Python版本是Python3.4,所以下載的包如下圖紅色框框所示。



6、下載完成之後,直接進入到下載的目錄,由此進入命令行窗口,輸入安裝命令“pip install Twisted-18.7.0-cp34-cp34m-win_amd64.whl”,一般是可以安裝上的,但是有時候會出現下面的錯誤提示“Twisted-18.7.0-cp34-cp34m-win_amd64.whl is not a supported wheel on this platform.”,表示該平臺不支持這個安裝包,如下圖所示。



7、此時不用慌,在這裏小編給大家介紹一個小技巧,專門用來應對這樣的問題的。進入到Twisted-18.7.0-cp34-cp34m-win_amd64.whl安裝包目錄下,一般下載之後將其放到虛擬環境的site-packages文件夾下面,爾後將後綴.whl更改爲.zip,有木有覺得很熟悉?對,它就是個壓縮文件,現在將壓縮包裏邊的內容全部解壓到當前文件夾,如下圖所示。

8、之後在虛擬環境下輸入pip list命令查看安裝包,可以看到Twisted安裝包已經在裏邊了,如下圖所示。第一個pip list命令的時候尚未解壓Twisted安裝包,此時並沒有Twisted庫;第二個pip list命令是在Twisted安裝包解壓之後執行的,可以看到Twisted庫已經在裏邊了。



9、爾後我們再次輸入Scrapy的安裝命令,“pip install -i pypi.douban.com/simple/Scrapy”,等待安裝完成,此時可以看到沒有任何的報錯了。

10、最後通過pip list查看Scrapy是否安裝成功,可以看到Scrapy已經在list之內了,如下圖所示。



至此,Scrapy的安裝已經順利完成。文中記錄的部分bug解決方法是很多小夥伴們都會遇到的問題,希望大家日後在安裝Scrapy的時候有章可循。最後,祝大家安裝Scrapy一切順利~~


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章