1. chome瀏覽器安裝和driver安裝
a)chrome瀏覽器下載
b)chome driver下載地址
driver下載時,選擇mac64版本的,請與chrome瀏覽器的版本匹配,至少是接近,否則易引起錯誤
chome driver下載完畢後,解壓後我直接將這個可執行程序放到了/usr/local/bin中
2、安裝python的selenium,pip install selenium
3、使用selenium寫個實驗程序:
#coding:utf-8
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import time
# 設置選項:無窗口後臺運行
chrome_options = Options()
chrome_options.add_argument('--headless')
# 取得driver
driver = webdriver.Chrome('/usr/local/bin/chromedriver', chrome_options=chrome_options)
# 訪問網頁
url = 'http://www.baidu.com'
driver.get(url)
time.sleep(1) # sleep 1s 等待加載網頁
# 打印源碼
print driver.page_source
driver.quit() # 關閉driver
4. webdriver常用操作: 連接 webdriver Python版實用指南
4.1 瀏覽器操作
#屬性:
driver.current_url #用於獲得當前頁面的URL
driver.title #用於獲取當前頁面的標題
driver.page_source #用於獲取頁面html源代碼
driver.port #用於獲取瀏覽器的端口
driver.capabilities['version'] #打印瀏覽器version的值
#瀏覽器:
driver.get(url):#瀏覽器加載url
driver.back() #瀏覽器後退
driver.forward() #瀏覽器前進
driver.refresh() #瀏覽器刷新(點擊刷新按鈕)
driver.set_page_load_timeout(5) #設置頁面加載時間,如果超時會跑異常
driver.implicitly_wait(秒) #隱式等待,通過一定的時長等待頁面上某一元素加載完成。
#若提前定位到元素,則繼續執行。等待10s若超過時間未加載出,則拋出NoSuchElementException異常。
#執行js:
driver.execute_script(js) #調用js
4.2 窗口和彈框操作
#窗口:
driver.current_window_handle #用於獲取當前窗口句柄
driver.window_handles #用於獲取所有窗口句柄
driver.maximize_window() #將瀏覽器最大化顯示
driver.set_window_size(480, 800) #設置瀏覽器寬480、高800顯示
driver.get_window_size() #獲取當前窗口的長和寬
driver.get_window_position() #獲取當前窗口座標
driver.set_window_position(300,200) #設置當前窗口座標
driver.get_screenshot_as_file(filename) #截取當前窗口
#實例:driver.get_screenshot_as_file('D:/selenium/image/baidu.jpg')
driver.close() #關閉當前窗口,或最後打開的窗口
driver.quit() #關閉所有關聯窗口,並且安全關閉session
#窗口切換:
driver.switch_to_frame(id或name屬性值)#切換到新表單(同一窗口)。若無id或屬性值,可先通過xpath定位到iframe,再將值傳給switch_to_frame()
driver.switch_to.parent_content()#跳出當前一級表單。該方法默認對應於離它最近的switch_to.frame()方法
driver.switch_to.default_content() #跳回最外層的頁面
driver.switch_to_window(窗口句柄) #切換到新窗口
driver.switch_to.window(窗口句柄) #切換到新窗口
#彈框切換:
driver.switch_to_alert() #警告框處理。處理JavaScript所生成的alert,confirm,prompt
driver.switch_to.alert() #警告框處理
4.3 cookies 操作
driver.get_cookies() #獲取當前會話所有cookie信息
driver.get_cookie(cookie_name) #返回字典的key爲“cookie_name”的cookie信息。
#實例:driver.get_cookie("NET_SessionId")
driver.add_cookie(cookie_dict) #添加cookie。“cookie_dict”指字典對象,必須有name和value值
driver.delete_cookie(name,optionsString) #刪除cookie信息
driver.delete_all_cookies() #刪除所有cookie信息
4.4 簡單對象的定位
'''
能通過id和name的,儘量不要用xpath和css
Id定位
唯一屬性定位
組合定位
先找到相鄰的元素
絕對路徑
'''
diver.find_element("xpath",".//a//span") # 利於封裝
driver.find_element_by_id()
driver.find_element_by_name()
driver.find_element_by_class_name()
driver.find_element_by_tag_name()
driver.find_element_by_link_text()
driver.find_element_by_partial_link_text() # 模糊查詢
driver.find_element_by_xpath()
driver.find_element_by_css_selector() # css選擇定位器
4.5 頁面元素操作
# 屬性:
element.size #獲取元素的尺寸。
element.text #獲取元素的文本。
element.tag_name #獲取標籤名稱
element.clear() #用於清除輸入框的默認內容
element.send_keys("xx") #用於在一個輸入框裏輸入 xx 內容
element.click() #用於單擊一個按鈕
element.submit() #提交表單
element.size #返回元素的尺寸
element.text #獲取元素文本
element.get_attribute('value')
#返回元素的屬性值,可以是id、name、type或元素擁有的其它任意屬性
#如果是input的,可以通過獲取value值獲得當前輸入的值
element.is_displayed ()
#返回元素的結果是否可見,返回結果爲True或False
element.is_enabled() #判斷元素是否可用
element.is_selected() #返回單選按鈕、複選框元素結果是否被選中(True 或 False)
element.value_of_css_property(height) #獲取元素css樣式屬性
4.6 鼠標事件
#引入ActionChains類
from selenium.webdriver.common.action_chains import ActionChains
mouse =driver.find_element_by_xpath("xx") #定位鼠標元素
#對定位到的元素執行鼠標操作
ActionChains(driver).context_click(mouse).perform() #鼠標右鍵操作
ActionChains(driver).double_click(mouse).perform() #鼠標雙擊操作
ActionChains(driver).move_to_element(mouse).perform() #鼠標移動到上面的操作
ActionChains(driver).click_and_hold(mouse).perform() #鼠標左鍵按下的操作
ActionChains(driver).release(mouse).perform() #鼠標釋放
#鼠標拖拽
element = driver.find_element_by_name("xxx") #定位元素的原位置
target = driver.find_element_by_name("xxx") #定位元素要移動到的目標位置
ActionChains(driver).drag_and_drop(element, target).perform() #執行元素的移動操作
4.7 鍵盤事件
#引入Keys類包
from selenium.webdriver.common.keys import Keys
element.send_keys(Keys.BACK_SPACE) #刪除鍵(BackSpace)
element.send_keys(Keys.SPACE) #空格鍵(Space)
element.send_keys(Keys.TAB) #製表鍵(Tab)
element.send_keys(Keys.ESCAPE) #回退鍵(Esc)
element.send_keys(Keys.ENTER) #回車鍵(Enter)
element.send_keys(Keys.CONTROL,'a') #全選(Ctrl+A)
element.send_keys(Keys.CONTROL,'c') #複製(Ctrl+C)
element.send_keys(Keys.CONTROL,'x') #剪切(Ctrl+X)
element.send_keys(Keys.CONTROL,'v') #粘貼(Ctrl+V)
element.send_keys(Keys.F12) #鍵盤F12
#輸入空格鍵+“python”
element.send_keys(Keys.SPACE)
element.send_keys("python")
4.8 用selenium提取html標籤中的@href鏈接
import time
from selenium import webdriver
if __name__ == '__main__':
url = "https://www.baidu.com"
driver = webdriver.Chrome()
driver.get(url)
driver.implicitly_wait(10)
time.sleep(2)
for link in driver.find_elements_by_xpath('//*[@id="u1"]/a'):
print(link.get_attribute('href'))
a = link.get_attribute('href')
print(a)
driver.quit()