使用xml模塊需先引入模塊名:
#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.ElementTree as ET #ET是xml模塊的別名
ET 模塊可以歸納爲三個部分:
1、ElementTree將整個XML文檔表示爲樹,並 Element表示此樹中的單個節點。與整個文檔的交互(讀取和寫入文件)通常在ElementTree關卡上完成。
2、與單個XML元素及其子元素的交互在該Element級別上完成。
3、以及一些操作 XML 的函數。
可以使用 ET 模塊的parse()函數來從指定的 XML 文件構造一個ElementTree對象:
# 獲取 XML 文檔對象 ElementTree
tree = ET.parse('test.xml') # <xml.etree.ElementTree.ElementTree object at 0x00000000021CCA20>
# 獲取 XML 文檔對象的根結點 Element
root = tree.getroot() # 獲取根節點 <Element 'data' at 0x0000000002110368>
# 打印根節點的名稱;獲取標籤名
print(root.tag) # tag函數用來打印根節點名稱
標籤分自閉合標籤和非自閉合標籤:
<year>2008</year> 非自閉合標籤
<neighbor name="Austria" direction="E"/> 自閉合標籤
例如:<APP_KEY channel = 'CSDN'> hello123456789 </APP_KEY>
tag 即標籤,用於標識該元素表示哪種數據,即APP_KEY
attrib 即屬性,用Dictionary形式保存,即{'channel' = 'CSDN'}
text 文本字符串,可以用來存儲一些數據,即hello123456789
data 是根節點
conuntry 是子節點;每個子節點有自己的標籤、屬性、文本字符串
獲取標籤名:
#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.cElementTree as ET
tree=ET.parse('test')
root=tree.getroot()
for i in root:
for j in i:
print(j.tag)
獲取標籤屬性:
#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.cElementTree as ET
tree=ET.parse('test')
root=tree.getroot()
for i in root:
print(i.attrib)
獲取子節點標籤名:
#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.cElementTree as ET
tree=ET.parse('test')
root=tree.getroot()
for i in root:
for j in i:
print(j.tag)
獲取子節點屬性:
#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.cElementTree as ET
tree=ET.parse('test')
root=tree.getroot()
for i in root:
for j in i:
print(j.attrib)
獲取子節點文本:
#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.cElementTree as ET
tree=ET.parse('test')
root=tree.getroot()
for i in root:
for j in i:
print(j.text)
iter()函數指定過濾出某一個tag(標籤):
#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.cElementTree as ET
tree=ET.parse('test')
root=tree.getroot()
for i in root.iter('year'): # 從“根”節點開始查找
print(i.tag,i.text)
以上實例輸出結果:
year 2008
year 2011
year 2011
set()函數新增屬性
#! /usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.cElementTree as ET
tree=ET.parse('test')
root=tree.getroot()
for i in root.iter('year'):
new_year=int(i.text)+1
i.text=str(new_year) #更新文本信息
i.set("updated","yes") # 更新/添加 屬性
tree.write('abc.xml') #從新寫入到新的文件中
del刪除標籤屬性
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.ElementTree as ET
tree=ET.parse('abc.xml')
root=tree.getroot()
for i in root.iter('year'):
del i.attrib['updated']
tree.write('abc.xml')
remove刪除整個子節點
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import xml.etree.ElementTree as ET
tree=ET.parse('abc.xml')
root=tree.getroot()
for i in root.iter('country'): #這裏必須寫子節點名稱,因爲下面的root.remove刪除的時候會引用
x=int(i.find('rank').text)
if x>=50:
root.remove(i) #刪除整個節點
tree.write('yedong.xml')