from selenium import webdriver
chromedriver_path = "D:/chromedriver/chromedriver.exe" # chromedriver的路徑
print("開始爬取")
# 創建chrome參數對象
options = webdriver.ChromeOptions()
options.add_argument('--no-sandbox') # 解決DevToolsActivePort文件不存在的報錯
# options.add_argument('--start-maximized') # 瀏覽器窗口最大化
options.add_argument('--window-size=1920,1080') # 指定瀏覽器窗口大小
options.add_argument('--disable-gpu') # 谷歌文檔提到需要加上這個屬性來規避bug
options.add_argument('--hide-scrollbars') # 隱藏滾動條, 應對一些特殊頁面
# options.add_argument('--blink-settings=imagesEnabled=false') # 不加載圖片,加快訪問速度
options.add_argument('--headless') # 瀏覽器不提供可視化頁面. linux下如果系統不支持可視化不加這條會啓動失敗
options.add_argument('test-type')
options.add_experimental_option("excludeSwitches", ["ignore-certificate-errors",
"enable-automation"])
# 此步驟很重要,設置爲開發者模式,防止被各大網站識別出來使用了Selenium
driver = webdriver.Chrome(options=options, executable_path=chromedriver_path)
driver.get('https://www.baidu.com/')
driver.save_screenshot("screenshot.png") # 對整個瀏覽器頁面進行截圖
driver.quit()
print("爬取完成")