python+selenium小結15：導入BeautifulSoup，獲取網頁源碼中某一屬性的值

原創

酷酷木女侠

2019-05-12 12:47

Beautiful Soup 是一個可以從HTML或XML文件中提取數據的Python庫.它能夠通過你喜歡的轉換器實現慣用的文檔導航,查找,修改文檔的方式.Beautiful Soup會幫你節省數小時甚至數天的工作時間.

安裝：$ pip install beautifulsoup4

Beautiful Soup 的介紹，具體參考文檔：https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html

導入BeautifulSoup，獲取網頁源碼中某一屬性的值，用得最多的方法就是find,find_all

"""獲取'https://blog.csdn.net/jusulysunbeamy'網頁源碼中data-articleid屬性的值"""

#!/usr/bin/env python 
# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup

#打印出a_url頁面的data-articleid屬性的值
a_url = 'https://blog.csdn.net/jusulysunbeamy'
html = requests.get(a_url)
pagesource = html.text
print(pagesource)
soup = BeautifulSoup(html.content, 'html.parser') 
ds = soup.find('div', class_='article-list').find_all('div', class_='article-item-box csdn-tracking-statistics')#進行條件匹配查找
for i in ds: #循環出我們查找到的數據
    print(i.attrs['data-articleid']) #打印出屬性的值

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

python+selenium小結15：導入BeautifulSoup，獲取網頁源碼中某一屬性的值

釘釘打卡速度慢

使用neovim打造go ide(支持代碼跳轉, 代碼補全, 實時語法檢查)

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Python 潮流週刊#51：用 Python 繪製美觀的圖表

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Android APP功能測試（個人總結完整版）

python+selenium小結10：引入庫PyUserInput，導入PyKeyboard類模擬鍵盤按鍵操作

python+selenium小結8：獲取頁面上錯誤提示文案

python+selenium小結13：通過A頁面的鏈接打開B頁面，在B頁面上操作

python+selenium小結9：判斷單選按鈕是否被選中

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結