序:
假期在學校安排的實習中,開始對python網絡爬蟲有了接觸。以Eclipse編譯器進行配置,來實現python網絡爬蟲。
本文介紹如何初始化一個webdriver實例對象driver,然後打開和關閉瀏覽器。要用selenium打開Firefox或者Chrome瀏覽器。
首先需要去下載一個driver插件geckodriver.exe/chromedriver.exe,可自行在網上搜索與自己瀏覽器版本相對應的插件,
下載好這個exe文件後,把這個文件放到你的python安裝目錄下,
例如:C:\Users\xyz\AppData\Local\Programs\Python\Python36\Scripts\chromedriver.exe。
進入Eclipse,點擊File—>New—>PyDev Project,創建一個新的項目:
右擊FristTest—>New—>PyDev Module:
創建自己 *.py 文件,寫入:
#coding:utf-8
from selenium import webdriver
dr = webdriver.Chrome() #打開谷歌瀏覽器
#dr = webdriver.Firefox()
url="http://www.baidu.com"
dr.get(url)
print("瀏覽百度完成")
運行結果:
自動化控制頁面: