使用selenium爬取动态页面

原創

weixin_41098099

2020-07-05 21:54

在爬取某些页面时，由於其一些内容是使用js动态加载，导致只能爬取到部分的内容（静态内容）。此时，可以使用selenium库来解决。

# coding=utf-8
from selenium import webdriver
from selenium.webdriver.chrome.options import Options

# 为了将Chrome不弹出界面，实现无界面爬取
chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
driver = webdriver.Chrome(options=chrome_options)

# 发送请求，这里选取的某当网一页面。
driver.get("http://product.dangdang.com/23997502.html#ddclick_reco_book")

# 保存爬取的网页内容
with open("111.html", "w", encoding="utf-8") as f:
    f.write(driver.page_source)

# 退出浏览器
driver.quit()

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

一键自动化博客发布工具,chrome和firfox详细配置

blog-auto-publishing-tools博客自動發佈工具現在已經可以同時支持chrome和firefox了。很多小夥伴可能對於如何進行配置和啓動不是很瞭解，今天帶給大家一個詳細的保姆教程，只需要跟着我的步驟一步來就可以無障礙啓

2024-05-04 21:30:29

一键自动化博客发布工具,用过的人都说好(简书篇)

好不容易寫好了一篇博客，現在想要把它發佈到各個平臺上供大家一起欣賞？然後一個網站一個網站打開要發佈的博客站點，手動點創建文章，然後拷貝粘貼寫的markdown文件。甚至有些網站還不支持markdown格式，你還需要對格式進行轉換。每次

2024-04-30 21:30:54

界面组件DevExpress中文教程 - 如何在Node.js应用中创建报表？

DevExpress Reporting是.NET Framework下功能完善的報表平臺，它附帶了易於使用的Visual Studio報表設計器和豐富的報表控件集，包括數據透視表、圖表，因此您可以構建無與倫比、信息清晰的報表。獲取Dev

2024-04-30 11:36:22

ArkTS开发原生鸿蒙HarmonyOS短视频应用

HarmonyOS實戰課程“2024鴻蒙零基礎快速實戰-仿抖音App開發（ArkTS版）”已經於今日上線至慕課網（https://coding.imooc.com/class/843.html），有致力於鴻蒙生態開發的同學們可以關注一下。

2024-04-29 23:07:45

JavaScript开发工具WebStorm v2024.1全新发布——增强全行代码补全功能

WebStorm 是jetbrains公司旗下一款JavaScript 開發工具，被廣大中國JS開發者譽爲"Web前端開發神器""強大的HTML5編輯器""智能的JavaSscript IDE"等。與IntelliJ IDEA同源，繼承了I

2024-04-29 11:35:39

使用JavaScript日历小部件和DHTMLX Gantt的应用场景（一）

DHTMLX Suite UI 組件庫允許您更快地構建跨平臺、跨瀏覽器 Web 和移動應用程序。它包括一組豐富的即用式 HTML5 組件，這些組件可以輕鬆組合到單個應用程序界面中。 DHTMLX Gantt是用於跨瀏覽器和跨平臺應用程序的功

2024-04-26 11:35:57

「实战应用」如何用图表控件LightningChart创建2D气泡图

LightningChartJS是Web上性能特高的圖表庫，具有出色的執行性能 - 使用高數據速率同時監控數十個數據源。 GPU加速和WebGL渲染確保您的設備的圖形處理器得到有效利用，從而實現高刷新率和流暢的動畫，常用於貿易，工程，航空航

2024-04-25 11:36:06

前端面试题 - 说一下原型和原型链？

前端面試題 - 說一下原型和原型鏈？ JavaScript 中，萬物皆對象，對象分爲普通對象和函數對象。所有的函數都是函數對象（typeof f === 'function'），其他都是普通對象（typeof o === 'object'

2024-04-24 23:51:10

前端面试题 - 为什么在JS中0.1+0.2!=0.3？以及IEE 754标准

前端面試題 - 爲什麼在JS中0.1+0.2!=0.3？以及IEE 754標準 JavaScript使用Number類型表示數字（整數和浮點數），遵循 IEEE 754 標準通過64位來表示一個數字。首先，計算機無法直接對十進制的數字進

2024-04-24 23:51:06

前端面试题 - NodeJS能用ES6模块吗？CommonJS 和 ES6模块的区别是什么？

前端面試題 - NodeJS能用ES6模塊嗎？CommonJS 和 ES6模塊的區別是什麼？ JS能寫前端web，也能寫NodeJS。 Node.js 後端應用由模塊組成，其模塊系統採用 CommonJS 規範，它並不是 JavaScri

2024-04-24 23:51:06

西安站开营！AI 编码助手通义灵码帮大学生“整活儿”

如何更好地與 AI 爲伴，做時代的先進開發者？4 月 17 日，阿里雲推出的 AI 編程助手通義靈碼與雲工開物“高校訓練營”走進西安多所高校開啓實操培訓，結合 AI 輔助編程的發展背景、通義靈碼的具體能力和應用實操，幫助在校大學生了解人工智

2024-04-24 21:12:06

「Java开发指南」如何利用MyEclipse启用Spring DSL？（二）

本教程將引導您通過啓用Spring DSL和使用Service Spring DSL抽象來引導Spring和Spring代碼生成項目，本教程中學習的技能也可以很容易地應用於其他抽象。在本教程中，您將學習如何：爲Spring DSL初始化

2024-04-24 11:35:31

高效率Python开发工具PyCharm v2024.1——更新AI Assistant功能

JetBrains PyCharm是一種Python IDE，其帶有一整套可以幫助用戶在使用Python語言開發時提高其效率的工具。此外，該IDE提供了一些高級功能，以用於Django框架下的專業Web開發。立即獲取PyCharm v20

2024-04-23 11:34:45

SpringBoot配置HTTPS及开发调试

前言在實際開發過程中，如果後端需要啓用https訪問，通常項目啓動後配置nginx代理再配置https，前端調用時高版本的chrome還會因爲證書未信任導致調用失敗，通過摸索整理一套開發調試下的https方案，特此分享後端配置生成HT

2024-04-29 21:38:23

Google Chrome驱动程序 124.0.6367.62（正式版本）去哪下载？

大家好，我是Python進階者。一、前言前幾天在Python白銀交流羣【Jethro Shen】問了一個Python谷歌驅動下載的問題。二、實現過程這裏【Kim】和【Crazy】給了一個指導，如上圖所示。說來奇怪，在鏈接中看了沒有

2024-04-24 09:48:52

24小時熱門文章

DAPPER 事务 TRANSACTION

最新文章

最新評論文章