總結一下自己學習minidom模塊的過程:
1 簡要了解一下xml文檔:
- DOM是 Document Object Model的簡稱,它以對象樹來表示一個XML文檔,使用它的好處是你可以非常靈活的遍歷xml文檔對象
- xml文檔是由樹狀元素組成,有一個唯一的根元素,也叫文檔元素。其他的元素和內容都包含在根元素中
- 元素:
--元素就是標記,元素與元素之間可以有文本,元素的內容也是文本
--元素是節點的一種,但不是葉子節點,元素下面有子節點
--每個節點有nodeName,nodeValue, nodeType屬性, nodeValue 是節點的值,只對textNode有效
--葉子節點,如文本節點,下面不再有子節點
--兩個節點之間的內容被視爲文本節點
2 xml文檔的讀取
-生成dom對象:
>>>from xml.dom.minidom import parse, parseString #導入parse, parseString function
>>>dom1 = parse("D:\xmlpath.xml") #parse解析XML文檔生成dom 對象
>>>dom2 = parseString("<tc> #parseString解析xml字符串生成dom對象
<prod>Adv</prod>
<version>14</version>
</tc>")
- 讀取文檔元素對象(根節點:tc)
>>>root1 = dom1.documentElement
>>>root2 = dom2.documentElement
-讀取節點屬性
>>>root1.nodeName
u'tc'
-子元素、子節點的訪問
--使用getElementsByTagName方法: 可以搜索已知元素名的所有子元素
>>>verNum = dom.getElementsByTagName("version")
>>>print verNum
[<DOM Element: verNum at 0x10a5ee6c8>]