python常用模塊之xml模塊

使用xml模塊需先引入模塊名:

#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.ElementTree as ET                       #ET是xml模塊的別名

ET 模塊可以歸納爲三個部分:
1、ElementTree將整個XML文檔表示爲樹,並 Element表示此樹中的單個節點。與整個文檔的交互(讀取和寫入文件)通常在ElementTree關卡上完成。
2、與單個XML元素及其子元素的交互在該Element級別上完成。
3、以及一些操作 XML 的函數。

可以使用 ET 模塊的parse()函數來從指定的 XML 文件構造一個ElementTree對象:

# 獲取 XML 文檔對象 ElementTree
tree = ET.parse('test.xml')                   #   <xml.etree.ElementTree.ElementTree object at 0x00000000021CCA20>

# 獲取 XML 文檔對象的根結點 Element
root = tree.getroot()                        #  獲取根節點 <Element 'data' at 0x0000000002110368>

# 打印根節點的名稱;獲取標籤名
print(root.tag)                             # tag函數用來打印根節點名稱
標籤分自閉合標籤和非自閉合標籤:
<year>2008</year>                           非自閉合標籤
<neighbor name="Austria" direction="E"/>    自閉合標籤

例如:<APP_KEY channel = 'CSDN'> hello123456789 </APP_KEY>
tag 即標籤,用於標識該元素表示哪種數據,即APP_KEY
attrib 即屬性,用Dictionary形式保存,即{'channel' = 'CSDN'}
text 文本字符串,可以用來存儲一些數據,即hello123456789

python常用模塊之xml模塊

data 是根節點
conuntry 是子節點;每個子節點有自己的標籤、屬性、文本字符串

python常用模塊之xml模塊

獲取標籤名:
#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.cElementTree as ET
tree=ET.parse('test')
root=tree.getroot()
for i in root:
    for j in i:
        print(j.tag)
獲取標籤屬性:
#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.cElementTree as ET
tree=ET.parse('test')
root=tree.getroot()
for i in root:
    print(i.attrib)
獲取子節點標籤名:
#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.cElementTree as ET
tree=ET.parse('test')
root=tree.getroot()
for i in root:
    for j in i:
        print(j.tag)
獲取子節點屬性:
#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.cElementTree as ET
tree=ET.parse('test')
root=tree.getroot()
for i in root:
    for j in i:
        print(j.attrib)
獲取子節點文本:
#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.cElementTree as ET
tree=ET.parse('test')
root=tree.getroot()
for i in root:
    for j in i:
        print(j.text)

iter()函數指定過濾出某一個tag(標籤):

#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.cElementTree as ET
tree=ET.parse('test')
root=tree.getroot()
for i in root.iter('year'):                       # 從“根”節點開始查找
    print(i.tag,i.text)

以上實例輸出結果:
year 2008
year 2011
year 2011

set()函數新增屬性

#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.cElementTree as ET
tree=ET.parse('test')
root=tree.getroot()
for i in root.iter('year'):
    new_year=int(i.text)+1
    i.text=str(new_year)                         #更新文本信息
    i.set("updated","yes")                         # 更新/添加  屬性

tree.write('abc.xml')                             #從新寫入到新的文件中

del刪除標籤屬性

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.ElementTree as ET
tree=ET.parse('abc.xml')
root=tree.getroot()
for i in root.iter('year'):
    del i.attrib['updated']
tree.write('abc.xml')

remove刪除整個子節點

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.ElementTree as ET
tree=ET.parse('abc.xml')
root=tree.getroot()
for i in root.iter('country'):      #這裏必須寫子節點名稱,因爲下面的root.remove刪除的時候會引用
    x=int(i.find('rank').text)
    if x>=50:
        root.remove(i)               #刪除整個節點

tree.write('yedong.xml')
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章