2.5-PhantomJS的安裝

PhantomJS是一個無界面的、可腳本編程的WebKit瀏覽器引擎,它原生支持多種Web標準:DOM操作、CSS選擇器、JSON、Canvas以及SVG。

Selenium支持PhantomJS,這樣在運行的時候就不會再彈出一個瀏覽器了。而且PhantomJS的運行效率也很高,還支持各種參數配置,使用非常方便。下面我們就來了解一下PhantomJS的安裝過程。

1. 相關鏈接

2. 下載PhantomJS

我們需要在官方網站下載對應的安裝包,PhantomJS支持多種操作系統,比如Windows、Linux、Mac、FreeBSD等,我們可以選擇對應的平臺並將安裝包下載下來。

下載完成後,將PhantomJS可執行文件所在的路徑配置到環境變量裏。比如在Windows下,將下載的文件解壓之後並打開,會看到一個bin文件夾,裏面包括一個可執行文件phantomjs.exe,我們需要將它直接放在配置好環境變量的路徑下或者將它所在的路徑配置到環境變量裏。比如,我們既可以將它直接複製到Python的Scripts文件夾,也可以將它所在的bin目錄加入到環境變量。

Windows下環境變量的配置可以參見1.1節,Linux及Mac環境變量的配置可以參見1.2.3節,在此不再贅述,關鍵在於將PhantomJS的可執行文件所在路徑配置到環境變量裏。

配置成功後,可以在命令行下測試一下,輸入:

phantomjs

如果可以進入到PhantomJS的命令行,那就證明配置完成了,如圖1-21所示。

1e.jpg

圖1-21 控制檯

3. 驗證安裝

在Selenium中使用的話,我們只需要將Chrome切換爲PhantomJS即可:

from selenium import webdriver
browser = webdriver.PhantomJS()
browser.get('https://www.baidu.com')
print(browser.current_url)

運行之後,我們就不會發現有瀏覽器彈出了,但實際上PhantomJS已經運行起來了。這裏我們訪問了百度,然後將當前的URL打印出來。

控制檯的輸出如下:

1    https://www.baidu.com/

如此一來,我們便完成了PhantomJS的配置,後面可以利用它來完成一些頁面的抓取。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章