xpath //

原創

zhaoyangjian724

2018-10-27 00:44

// 雙斜槓 定位根節點，會對全文進行掃描，在文檔中選取所有符合條件的內容，以列表的形式返回。
//從匹配選擇的當前節點選擇文檔中的節點，而不考慮它們的位置。

# !/usr/bin/env python
# -*- coding: utf-8 -*-
from lxml import etree

# 獲取文件元素
from lxml import etree

# 獲取文件元素
htmlEmt = etree.parse('text.xml')
# 獲取所有的 <li> 標籤
result = htmlEmt.xpath('//li')
print(result)
print type(result)
for x in result:
    print x
    print type(x)
    print x.text
	
C:\Python27\python.exe C:/Users/TLCB/PycharmProjects/untitled/xpath/l1.py
[<Element li at 0x26da9e0>, <Element li at 0x26da198>, <Element li at 0x26da030>, <Element li at 0x26da0d0>, <Element li at 0x26da238>]
<type 'list'>
<Element li at 0x26da9e0>
<type 'lxml.etree._Element'>
a01
<Element li at 0x26da198>
<type 'lxml.etree._Element'>
b02
<Element li at 0x26da030>
<type 'lxml.etree._Element'>
c03
<Element li at 0x26da0d0>
<type 'lxml.etree._Element'>
d04
<Element li at 0x26da238>
<type 'lxml.etree._Element'>
e05

Process finished with exit code 0

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Python 爬蟲求職計劃

現狀： 2019年之前從事C語言開發，現在剛接觸android開發，但是一直很喜歡Python，工作之餘有學習。目前的情況是Python基礎學過一遍，項目也有做，但總覺得有的地方沒喫透。離求職Python的崗位還是有點困難的。因此需要再鞏

2020-07-07 03:52:20

python3 selenium 登錄douban,獲取cookie

selenium登錄豆瓣流程: 1. 進入豆瓣登錄頁面 2. 切換到**子框架**,定位**用戶,密碼**輸入框. 並輸入數據,再**定位登錄**按鍵,點擊登錄. 3. 返回登錄成功後的cookies, 4. 關閉驅動瀏覽器.

2020-06-25 22:59:50

利用python編寫一個簡單的爬糗事百科熱圖爬蟲

python爬蟲，爬取糗事百科並保存到文件中以下是代碼實現部分，如果對你有幫助，留下一個贊 from urllib import request from lxml import etree from urllib import

赵北北北北北

2020-06-23 12:30:52

appium 尋找文本元素

1、通過文字尋找 find_element_by_android_uiautomator driver.find_element_by_android_uiautomator('text(\"按鈕\")').click()

2020-06-23 10:04:33

python + selemium 知識點總結

文章目錄1、元素查找 1、元素查找 (1)find_element_by_xpath 待續···

2020-06-23 10:04:32

selenium StaleElementReferenceException

在做自動化測試的時候，遇到此問題多次： StaleElementReferenceException: Message: stale element reference: element is not attached to th

2020-06-23 10:04:32

Chrome Driver 與 Chrome 版本對應表 / Ie

ChromeDriver Version Chrome Version 2.35 62-64 2.36 63-65 2.37 64-66 2.38 65-67 2.39 66-68 2.40 66

2020-06-23 10:04:32

python爬蟲工程師成長之路三 URLlib庫和URLError處理

文章目錄URLlib庫概述使用URLlib爬取網頁urllib常用方法瀏覽器僞裝獲取瀏覽器Headers屬性使用build_opener()修改報頭使用add_header()添加報頭超時設置http協議請求代理服務器設置Debu

2020-06-23 02:55:49

python爬蟲工程師成長之路七(二) Beautiful Soup4(二)

文章目錄遍歷文檔樹搜索文檔樹find_all(name,attrs,recursive,string,limit,**kwargs)find_all(name,attrs,recursive,string,**kwargs)fin

2020-06-23 02:55:49

python爬蟲工程師成長之路七(一) Beautiful Soup4(一)

文章目錄Beautiful Soup4 簡介Beautiful Soup4 解析器Beautiful Soup4 安裝Beautiful Soup4 解析器安裝Beautiful Soup4 簡單使用Beautiful Soup4

2020-06-23 02:55:48

python爬蟲工程師成長之路四正則表達式與Cookie

文章目錄正則表達式介紹正則表達式基礎原子元字符模式修正貪婪模式、懶惰模式常用函數re.match()re.search()全局匹配函數re.sub()Cookie介紹cookie處理——cookiejar 正則表達式介紹正則表達

2020-06-23 02:55:48

python爬蟲工程師成長之路六(一) 非結構化數據之XPath

文章目錄XPath 介紹XPath 節點XPath 語法路徑表達式謂語通配符選取若干路徑XPath 軸步(step)XPath 運算符 XPath 介紹 XPath(XML Path Language)是XML路徑語言用來，定

2020-06-23 02:55:48

python爬蟲工程師成長之路一初識爬蟲

文章目錄爬蟲簡介爲什麼要學習爬蟲爬蟲的結構爬蟲的類型聚焦爬蟲的工作原理和過程爬蟲常用功能搜索引擎介紹用戶爬蟲爬蟲簡介爬蟲，就是網絡爬蟲，也稱爲網頁蜘蛛、網絡機器人、網絡螞蟻等，可以根據我們制定的規則自動的瀏覽互聯網中的信息。

2020-06-23 02:55:48

python爬蟲工程師成長之路五(一) 爬取京東商城圖片

文章目錄爬取京東筆記本圖片爬取京東筆記本圖片選取爬取目標選取我們的爬取目標，電腦中的筆記本，我們發現url如下 https://list.jd.com/list.html?cat=670,671,672 構建

2020-06-23 02:55:48

python爬蟲工程師成長之路五(二) 多線程爬蟲

文章目錄多線程爬蟲介紹多線程介紹多線程爬蟲實戰多線程爬蟲介紹在之前博客裏(鏈接如下)爬取京東商品圖片時，爬取流程是依次進行的，這種執行流程稱爲單線程結構，單線程結構的爬蟲稱爲單線程爬蟲爬蟲實戰爬取京東商城圖片多線程

2020-06-23 02:55:48

24小時熱門文章

Wireshark 安裝+使用（一）

最新文章

最新評論文章