xml&json

Contents


What’s XML?
From Wikipedia:

  • Extensible Markup Language (XML) is a markup language that defines a set of rules for encoding documents in a format that is both human-readable and machine-readable.
  • The design goals of XML emphasize simplicity, generality, and usability across the Internet.
  • It is a textual data format with strong support via Unicode for different human languages. Although the design of XML focuses on documents, the language is widely used for the representation of arbitrary data structures.
  • There are many APIs to aid the processing of XML data.
  • xml就是純文本,關鍵是處理它的程序.
  • Light weight VS heavy weight Data Transmission.
  • @It’s said that 現在JSON已經逐漸超越了XML,各大網站提供的數據接口一般都是JSON@
  • XML和HTML爲不同的目的而設計:XML被設計爲傳輸和存儲數據,其焦點是數據的內容;HTML被設計用來顯示數據,其焦點是數據的外觀。
  • HTML旨在顯示信息,而 XML 旨在傳輸信息。
  • XML標籤沒有被預定義,需要自定義標籤.
  • xml自定義標籤
      XML被設計用來結構化、存儲以及傳輸信息,它沒有預定義的標籤。 需要編寫軟件或者程序,才能傳送、接收和顯示出這個文檔(otherwise 你咋知道自定義的標籤是啥意思).
  • 在HTML中使用的標籤(以及HTML的結構)是預定義的。HTML文檔只使用在HTML標準中定義過的標籤(比如<p>,<h1> 等等)。
  • xml parsing
     XML目前設計了兩種解析方式:DOM和 SAX
  1. DOM:把一個數據交換格式XML看成一個DOM,需要把XML文件整個讀入內存

DOM: Document Object Model.
XML DOM定義了所有XML元素的對象和屬性,以及訪問它們的方法(接口)。
XML DOM是個複雜的東西,有興趣再深入.

  1. SAX:不需要整個讀入文檔就可以對解析出的內容進行處理,是一種逐步解析的方法。程序也可以隨時終止解析。這樣,一個大的文檔就可以逐步的、一點一點的展現出來,所以SAX適合於大規模的解析。
  • It’s said that “XML是各種應用程序之間進行數據傳輸的最常用工具”
  • xml中所有元素都必須有關閉標籤(html中可以沒有關閉,用下一個的開始);
  • xml文檔必須有一個根元素(name at will).
  • 與 HTML 類似,XML 也可擁有屬性(名稱/值的對)。 在 XML 中,XML 的屬性值須加引號。e.g. <note data=“Helloworld”>
  • 在 XML 中,空格會被保留 HTML 會把多個連續的空格字符裁減(合併)爲一個
  • 註釋類似html: <!-- This is a comment -->
  • 只有CDATA區段(CDATA section)中的文本會被解析器忽略。
  • Steps of XML Parsing
  1. xml file is a tree,
  2. find the node, search recursively, to get the basic unit -> element
  3. parse each element, get the string of each element
  4. handle the data.
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章