【Python】CSS選擇器語法

原創

2020-07-08 09:13

常用語法

語法	說明
*	選擇所有節點
#container	選擇id爲container的節點
.container	選擇所有class包含container的節點
div,p 選擇所有	div 元素和所有 p 元素
li a	選取所有li 下所有a節點
ul + p	選取ul後面的第一個p元素
div#container > ul	選取id爲container的div的第一個ul子元素
ul ~p	選取與ul相鄰的所有p元素
a[title]	選取所有有title屬性的a元素
a[href=”http://baidu.com”]	選取所有href屬性爲http://baidu.com的a元素
a[href*=”baidu”]	選取所有href屬性值中包含baidu的a元素
a[href^=”http”]	選取所有href屬性值中以http開頭的a元素
a[href$=”.jpg”]	選取所有href屬性值中以.jpg結尾的a元素
input[type=radio]:checked	選擇選中的radio的元素
div:not(#container)	選取所有id爲非container 的div屬性
li:nth-child(3)	選取第三個li元素
li:nth-child(2n)	選取第偶數個li元素
a::attr(href)	選取a標籤的href屬性
a::text	選取a標籤下的文本

使用示例

scrapy shellhttp://blog.jobbole.com/102337/

1.提取title
>>> response.css(".entry-header h1::text").extract()[0]

2.提取日期
>>> response.css("p.entry-meta-hide-on-mobile::text").extract()[0].strip()

3、提取點贊數
>>> response.css(".vote-post-up  h10::text").extract()[0]

4、提取收藏數
>>> response.css(".bookmark-btn::text").extract()[0]

5、提取評論數
>>> response.css("a[href='#article-comment'] span::text").extract()[0]

6.提取內容
>>> response.css ( ".entry" ).extract()[0]

7、提取tag標籤
>>> response.css(".entry-meta-hide-on-mobile a::text").extract()

參考：https://www.jianshu.com/p/b67d0d851c1a

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【Python】CSS選擇器語法

常用語法

使用示例

自學編程兩個月，現在我月入 4 萬元

「實戰應用」如何用圖表控件LightningChart創建2D氣泡圖

百度安全多篇議題入選Blackhat Asia以硬技術發現“芯”問題

Google Chrome驅動程序 124.0.6367.62（正式版本）去哪下載？

【Java】【基礎篇】day17：集合框架的工具類（Arrays、Collections）

【算法】【遞歸篇】【樹】第8節：leetcode 102. 二叉樹的層序遍歷（BFS與DFS）

【算法】leetcode 837. 新21點（理清思路，動態規劃）

【算法】leetcode 990. 等式方程的可滿足性（並查集）

【算法】【動態規劃篇】第10節：最長連續序列問題（leetcode 128. 最長連續序列）（使用hash表優化空間複雜度）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結