用xpath判斷網頁上的某個字段是否存在

原創

2019-06-11 18:26

數據採集時，多個同類型網頁上字段種類、數量可能不一致。有時需要我們判斷該字段是否在網頁上，使用xpath可以用標籤包含某個文本的方式。

部分代碼如下：
在不知道Checks for plagiarism字段是否存在的情況下，可以用

try:
	pq = doc.xpath("//p[contains(text(),'Checks for plagiarism')]")[0]
except Exception as e:
	pq = ''

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Linux 命令大放送！（第一輯）

涓涓細流，終匯大海。在 "Shell 小技能" 一文中，講到了 Shell 組合 linux 命令的實用小技能。每一條 linux 命令，都是一個小工具。 Shell 可以將很多小工具組合成更強大的實用工具。本文主要梳理程序員常用

琴水玉

2024-06-16 13:39:44

Windows開的熱點手機能連上但上不了網

什麼更新驅動，設置“允許共享...”，啓動幾個服務都沒用，對我有用的辦法是：刪除註冊表鍵HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\WlanSvc\Parameters\Ho

ahdung

2024-06-16 13:39:14

dotnet 簡單控制檯使用 KernelMemory 向量化文本嵌入生成和查詢

本文將和大家簡單介紹一下如何在控制檯裏面使用 Microsoft.KernelMemory 調用 TextEmbedding 對一些文本知識庫內容生成向量化信息，以及進行向量化查詢本文屬於 SemanticKernel 入門系列博客，更多

indexi

2024-06-16 13:38:54

WPF 通過 SetWindowDisplayAffinity 配置禁止對窗口進行截圖或錄屏

有些應用程序比較機密或隱私，不期望被其他截圖軟件截圖到應用的窗口，或者被錄屏軟件錄製到。簡單的方法是通過 SetWindowDisplayAffinity 方法進行配置窗口阻止截圖軟件對其截圖開始之前必須說明的是對抗截圖錄屏是一個矛和盾的

indexi

2024-06-16 13:38:54

Vue微前端架構與Qiankun實踐理論指南

title: Vue微前端架構與Qiankun實踐理論指南 date: 2024/6/15 updated: 2024/6/15 author: cmdragon excerpt: 這篇文章介紹了微前端架構概念，聚焦於如何在Vue.j

Mifen

2024-06-16 13:38:23

博客園商業化之路-衆包平臺：繼續召集早期合作開發者

會員、周邊、廣告是園子現在維持生存的主要收入來源，而衆包平臺是園子未來實現商業化規模增長的希望所在。今年5月開始的衆包平臺建設是萬里長征，不僅需要融資，還需要找到合夥人組建新的團隊。雖然當前既沒有錢又沒人，但萬里長征已經邁出了第一步，採用

博客園團隊

2024-06-16 13:30:43

Linux內核版本以及部分參數與性能之二

Linux內核版本以及部分參數與性能之二版本範圍 grubby --set-default /boot/vmlinuz-6.9.4-1.el7.elrepo.x86_64 grubby --set-default /boot/vmlin

濟南小老虎

2024-06-16 13:29:23

[轉帖]性能分析之TCP全連接隊列佔滿問題分析及優化過程

https://cloud.tencent.com/developer/article/1558493 前言在對一個擋板系統進行測試時，遇到一個由於TCP全連接隊列被佔滿而影響系統性能的問題，這裏記錄下如何進行

濟南小老虎

2024-06-16 13:29:23

那些日子九

其實有人可能會問，你怎麼挺多故事或者爲什麼看着你的文章總感覺你像一個真正處在巔峯時期的作者一樣文思泉湧呢？你要知道的是，我也玩遊戲，還一度沉迷過當然別學我，如果現在讓我重新選擇，我會把玩遊戲的時間玩遊戲花的錢都用在投資自己上，或者做好健身

wizard_Q

2024-06-16 13:28:43

那些日子十三

一週工作結束，打卡下班、跑步、回宿舍。打開好友喜歡的音樂開始聽起來，其實對音樂我不是太懂，只知道有幾種分類，比如搖滾啊、流行音樂、說唱、R&B……從最早的流行歌曲開始聽，現在大概會唱的歌沒有一百也有幾十首吧，有些流行歌曲真的是讓人朗朗上口

wizard_Q

2024-06-16 13:28:33

那些日子十

沒有網絡的世界，簡單純粹。雖然我有買過一些電子書，但是實體書也是買過一些的，大部分是爲了找份好工作而買的專業類書籍，很少買閒書。其實閒書也是看過一些的，比如《故事會》，還有一些有點忘記名字的刊物，都是父上看過的，儘管這些書裏面沒有太多富

wizard_Q

2024-06-16 13:28:33

那些日子十二

我的記錄也不是太順序的，像軟件項目的不同開發方式，有瀑布式和敏捷式，而我的記錄大多時候是敏捷式，想到什麼記錄什麼。前面大部分在記錄我的工作歷程，或者說是退伍後開始幹了些啥，說起退伍，應該是前天，在某信的視頻號刷到的做煎餅銷售的退伍小哥，我

wizard_Q

2024-06-16 13:28:33

根據項目用例圖用例點估算項目工時的方法

一共通過6個步驟: 計算未調整的角色權值UAW 計算未調整的用例權值UUCW 計算未調整的用例點UUCP 計算技術(TCF)和環境因子(ECF) -> TEF 計算調整的用例點UCP 計算工作量(man - hours)多少人多少工時

wizard_Q

2024-06-16 13:28:33

Linux下以從官網上下載的go1.22.3.linux-amd64.tar.gz創建Golang鏡像

關於go1.22.3.linux-amd64.tar.gz創建Golang鏡像部份 1.首先從官網下載 https://golang.google.cn/dl/ go1.22.3.linux-amd64.tar.gz 2.

酒沉吟

2024-06-16 13:25:12

golang 同時(一個項目)註冊http和GRPC服務

main 裏面 package main import ( "fmt" "github.com/gin-gonic/gin" "github.com/hashicorp/consul/api" grpc

酒沉吟

2024-06-16 13:25:12

24小時熱門文章

用xpath判斷網頁上的某個字段是否存在

xpath 定位同級倒數第二個元素

Python：key沒有引號的字符串如何轉json

CentOS7 開機自動掛載

CentOS7修改系統編碼

使用xshell上傳、下載文件（使用sz與rz命令）

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結