python學習:使用xml.dom.minidom讀取xml文檔內容

總結一下自己學習minidom模塊的過程:

1 簡要了解一下xml文檔:

  - DOM是 Document Object Model的簡稱,它以對象樹來表示一個XML文檔,使用它的好處是你可以非常靈活的遍歷xml文檔對象

 - xml文檔是由樹狀元素組成,有一個唯一的根元素,也叫文檔元素。其他的元素和內容都包含在根元素中

 - 元素: 

    --元素就是標記,元素與元素之間可以有文本,元素的內容也是文本

    --元素是節點的一種,但不是葉子節點,元素下面有子節點

    --每個節點有nodeName,nodeValue, nodeType屬性, nodeValue 是節點的值,只對textNode有效

    --葉子節點,如文本節點,下面不再有子節點

    --兩個節點之間的內容被視爲文本節點

2  xml文檔的讀取

 -生成dom對象:

>>>from xml.dom.minidom import parse, parseString    #導入parse, parseString function

>>>dom1 = parse("D:\xmlpath.xml")        #parse解析XML文檔生成dom 對象

>>>dom2 = parseString("<tc>     #parseString解析xml字符串生成dom對象
<prod>Adv</prod>

<version>14</version>

</tc>")

  - 讀取文檔元素對象(根節點:tc)

>>>root1 = dom1.documentElement

>>>root2 = dom2.documentElement

  -讀取節點屬性

>>>root1.nodeName

u'tc'

  -子元素、子節點的訪問

--使用getElementsByTagName方法: 可以搜索已知元素名的所有子元素

>>>verNum = dom.getElementsByTagName("version")

>>>print verNum

[<DOM Element: verNum at 0x10a5ee6c8>]


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章