使用 Python ElementTree 生成 xml

Python 處理 xml 文檔的方法有很多,除了經典的 sax 和 dom 之外,還有一個 ElementTree。

首先 import 之:

1
from xml.etree import ElementTree as etree

然後開始構建 xml 樹:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
from xml.etree.ElementTree import Element, SubElement, ElementTree
 
# 生成根節點
root = Element('root')
# 生成第一個子節點 head
head = SubElement(root, 'head')
# head 節點的子節點
title = SubElement(head, 'title')
title.text = 'Well Dola!'
# 生成 root 的第二個子節點 body
body = SubElement(root, 'body')
# body 的內容
body.text = 'I love Dola!'
tree = ElementTree(root)

這樣就得到了一個 xml 樹的對象 tree 以及它的根節點的對象 root

接着我們把它們變成 xml 串,有兩個辦法,一個是用 tree 對象的 write 方法將 xml 內容寫成一個文件,還有一個是用 etree 的 tostring 方法轉成 xml 字符串:

1
2
3
4
5
# 第一種
tree.write('result.xml', encoding='utf-8')
# 第二種
xml_string = etree.tostring(root)
# xml_string 就是 xml 字符串了

但是第二種有一個問題,就是它沒有

1
<?xml version="1.0"?>

這個頭部定義內容:

1
'<root><head><title>Well Dola!</title></head><body>I love Dola!</body></root>'

怎麼辦呢?

有一個辦法是使用 minidom 來實現,方法如下:

1
2
3
4
5
from xml.dom import minidom
# 使用 minidom 解析
tree = minidom.parseString(xml_string)
# 重新生成 xml 字符串
xml_string = tree.toxml()

雖然讓計算機多運行了一些代碼,但是這樣可以把問題解決掉。

最後生成的 xml 代碼如下:

1
u'<?xml version="1.0" ?><root><head><title>Well Dola!</title></head><body>I love Dola!</body></root>'

當然還可以使用 minidom 中 tree 對象的 toprettyxml 方法把 xml 打得漂亮一點。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章