使用selenium爬取動態頁面

原創

weixin_41098099

2020-07-05 21:54

在爬取某些頁面時，由於其一些內容是使用js動態加載，導致只能爬取到部分的內容（靜態內容）。此時，可以使用selenium庫來解決。

# coding=utf-8
from selenium import webdriver
from selenium.webdriver.chrome.options import Options

# 爲了將Chrome不彈出界面，實現無界面爬取
chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
driver = webdriver.Chrome(options=chrome_options)

# 發送請求，這裏選取的某當網一頁面。
driver.get("http://product.dangdang.com/23997502.html#ddclick_reco_book")

# 保存爬取的網頁內容
with open("111.html", "w", encoding="utf-8") as f:
    f.write(driver.page_source)

# 退出瀏覽器
driver.quit()

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

瀏覽器輸入地址訪問網頁過程

瀏覽器輸入地址當在瀏覽器中輸入網址的時候，瀏覽器其實就可能的匹配可能得 url 了，它會從歷史記錄，書籤等地方，找到已經輸入的字符串可能對應的 url，然後給出智能提示，讓你可以補全url地址。對於 google的chrome 的瀏覽

2024-04-16 11:34:39

「實戰應用」如何用圖表控件LightningChart創建2D氣泡圖

LightningChartJS是Web上性能特高的圖表庫，具有出色的執行性能 - 使用高數據速率同時監控數十個數據源。 GPU加速和WebGL渲染確保您的設備的圖形處理器得到有效利用，從而實現高刷新率和流暢的動畫，常用於貿易，工程，航空航

2024-04-25 11:36:06

前端面試題 - 說一下原型和原型鏈？

前端面試題 - 說一下原型和原型鏈？ JavaScript 中，萬物皆對象，對象分爲普通對象和函數對象。所有的函數都是函數對象（typeof f === 'function'），其他都是普通對象（typeof o === 'object'

2024-04-24 23:51:10

前端面試題 - 爲什麼在JS中0.1+0.2!=0.3？以及IEE 754標準

前端面試題 - 爲什麼在JS中0.1+0.2!=0.3？以及IEE 754標準 JavaScript使用Number類型表示數字（整數和浮點數），遵循 IEEE 754 標準通過64位來表示一個數字。首先，計算機無法直接對十進制的數字進

2024-04-24 23:51:06

前端面試題 - NodeJS能用ES6模塊嗎？CommonJS 和 ES6模塊的區別是什麼？

前端面試題 - NodeJS能用ES6模塊嗎？CommonJS 和 ES6模塊的區別是什麼？ JS能寫前端web，也能寫NodeJS。 Node.js 後端應用由模塊組成，其模塊系統採用 CommonJS 規範，它並不是 JavaScri

2024-04-24 23:51:06

西安站開營！AI 編碼助手通義靈碼幫大學生“整活兒”

如何更好地與 AI 爲伴，做時代的先進開發者？4 月 17 日，阿里雲推出的 AI 編程助手通義靈碼與雲工開物“高校訓練營”走進西安多所高校開啓實操培訓，結合 AI 輔助編程的發展背景、通義靈碼的具體能力和應用實操，幫助在校大學生了解人工智

2024-04-24 21:12:06

「Java開發指南」如何利用MyEclipse啓用Spring DSL？（二）

本教程將引導您通過啓用Spring DSL和使用Service Spring DSL抽象來引導Spring和Spring代碼生成項目，本教程中學習的技能也可以很容易地應用於其他抽象。在本教程中，您將學習如何：爲Spring DSL初始化

2024-04-24 11:35:31

高效率Python開發工具PyCharm v2024.1——更新AI Assistant功能

JetBrains PyCharm是一種Python IDE，其帶有一整套可以幫助用戶在使用Python語言開發時提高其效率的工具。此外，該IDE提供了一些高級功能，以用於Django框架下的專業Web開發。立即獲取PyCharm v20

2024-04-23 11:34:45

日程安排組件DHTMLX Scheduler v7.0新版亮點 - 擁有多種全新的主題

DHTMLX Scheduler是一個類似於Google日曆的JavaScript日程安排控件，日曆事件通過Ajax動態加載，支持通過拖放功能調整事件日期和時間，事件可以按天、周、月三個種視圖顯示。備受關注的DHTMLX Schedule

2024-04-11 11:34:05

ES6生成器，看似同步的異步流程控制表達風格

本文分享自華爲雲社區《3月閱讀周·你不知道的JavaScript | ES6生成器，看似同步的異步流程控制表達風格》，作者：葉一一。生成器打破完整運行 JavaScript開發者在代碼中幾乎普遍依賴的一個假定：一個函數一旦開始執行

2024-04-10 22:32:56

「實戰應用」如何用圖表控件LightningChart創建JS堆疊條形圖？

LightningChartJS是Web上性能特高的圖表庫，具有出色的執行性能 - 使用高數據速率同時監控數十個數據源。 GPU加速和WebGL渲染確保您的設備的圖形處理器得到有效利用，從而實現高刷新率和流暢的動畫，常用於貿易，工程，航空航

2024-04-10 11:34:32

Google Chrome驅動程序 124.0.6367.62（正式版本）去哪下載？

大家好，我是Python進階者。一、前言前幾天在Python白銀交流羣【Jethro Shen】問了一個Python谷歌驅動下載的問題。二、實現過程這裏【Kim】和【Crazy】給了一個指導，如上圖所示。說來奇怪，在鏈接中看了沒有

2024-04-24 09:48:52

WebDriver庫：實現對音頻文件的自動下載與保存

1. 背景介紹音頻娛樂在當今社會已經成爲了人們日常生活中不可或缺的一部分。從早晨的音樂播放到晚上的電臺節目，音頻內容貫穿了我們的整個生活。隨着互聯網的普及和技術的進步，越來越多的音頻內容通過網絡平臺進行傳播和分享。網易雲音樂作爲中國領

2024-04-22 23:25:04

實戰剖析-vue項目首屏加載時長優化

現狀分析：首屏速度是用戶體驗的最關鍵一環，而首屏速度最大的決定性因素就是資源的加載速度，資源加載速度等於資源大小 + 網速，老的前端項目隨着不斷增長，代碼可能會變得混亂，冗餘難以理解，不斷的做加法，久而久之，前端性能上就會受到影響，

2024-04-22 11:16:32

探祕Python爬蟲技術：王者榮耀英雄圖片爬取

項目需求作爲一款風靡全球的MOBA遊戲，《王者榮耀》擁有衆多精美絕倫的英雄角色。玩家們對於自己心愛的英雄角色總是充滿着熱情和好奇。他們渴望收集自己喜歡的英雄的圖片，用於做壁紙、頭像或者分享給朋友。然而，要手動一張一張地下載這些圖片實

2024-04-19 23:26:23

24小時熱門文章

最新文章

最新評論文章