用Selenium 爬蟲下載文件,解除Chrome 下載警告 (Keep or Discard),設置下載目錄的方法

寫在前面的話

我們的描述,運用都是基於Ubuntu 的運行環境

Chrome : Version 77.0.3865.90 (Official Build) (64-bit)
OS : Ubuntu 18.04
python : 2.7, 3.4+
selenium : 3.141.0


場景描述

當我們用Selenium 爬蟲來下載文件的時候,這個時候需要對Chrome 進行一些額外的設置,保證用Chrome來瀏覽下載文件的時候,不會提示我們 保留(Keep)或者拋棄(Discard),也就是自動保存。

一般Chrome默認的下載,如果他認爲這是一個比較危險的文件,這個時候可能需要詢問用戶是不是保留或者刪除。一般需要用戶自己點擊,我們現在要完成的事情就是讓它不詢問我們,然後自動下載保存到我們想要保存的目錄下面即可。

from selenium import webdriver

download_dir = "/pathToDownloadDir"
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--no-sandbox')
preferences = {"download.default_directory": download_dir ,
               "directory_upgrade": True,
               "safebrowsing.enabled": True }
chrome_options.add_experimental_option("prefs", preferences)
   try:
        driver = webdriver.Chrome(chrome_options=chrome_options,\
        executable_path=r'/pathTo/chromedriver')
    except:
        continue
driver.get("urlFileToDownload");

說明: “safebrowsing.enabled”: True參數。增加了這個參數。就不會彈出保存與放棄的提示


Reference

https://blog.csdn.net/weixin_30296405/article/details/99854704

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章