使用Selenium爬蟲進階

selenium 是一個自動化的web 瀏覽器的測試工具,我們可以用selenium 來模擬人對瀏覽器(browser)的操作,我們也可以使用這個工具來做爬蟲。

具體的情況可以參考相關的官網: https://selenium.dev

我用python 來做開發,因此這裏我們下載相關的文件,用這個網站 https://selenium.dev/downloads/

安裝Selenium

安裝 selenium 3.141.0 , 具體的方法你也可以參考官網 https://pypi.org/project/selenium/

方法就是

pip install selenium

安裝驅動 (Drivers)

使用我們的Selenium 我們需要選擇對應瀏覽器相關的驅動, 我用的是chrome,
現在它支持的是

瀏覽器 鏈接
FireFox https://github.com/mozilla/geckodriver/releases
Chrome https://sites.google.com/a/chromium.org/chromedriver/downloads
Edge https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/
Safari https://webkit.org/blog/6900/webdriver-support-in-safari-10/

我們只需要根據我們自己想要的瀏覽器,來下載相關的驅動, 我用的是chrome,因此我 到對應的link 去下載我的驅動: https://sites.google.com/a/chromium.org/chromedriver/downloads

它給出的可以選擇的瀏覽器驅動有78,77,79 這三個可以選擇

根據它的官網,你可以看到:
在這裏插入圖片描述

所以具體要選擇哪個,要看一看你的瀏覽器的是哪個版本,怎麼看,我們先點擊我chrome右上角的那三個小的點點。

選擇chrome 的Help ,之後可以看見 about chrome,點擊進去就可以看到了, 或者直接輸入 chrome://settings/help, 也可以看到

在這裏插入圖片描述

上圖就是我的瀏覽器的型號, 是 Version 77.0.3865.90 (Official Build) (64-bit)

我只要選擇那個77 ,到相關的網站 https://chromedriver.storage.googleapis.com/index.html?path=77.0.3865.40/ 就可以了。

如下圖所示:
在這裏插入圖片描述

使用說明

以Firefox 爲例子,我們來看一下

from selenium import webdriver

browser = webdriver.Firefox()
browser.get('http://seleniumhq.org/')

chrome 的例子

from selenium import webdriver
driver = webdriver.Chrome()
driver.get('https://www.google.cz')


來吧~~~
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章