Xml簡介_動力節點Java學院整理

XML 只是基於普通文本,但卻提供了幾乎可以在任何兩個應用程序間共享數據的方式

XML(簡介)

       XML(可擴展標記語言)在 20 世紀 90 年代後期登上舞臺後,就一直是衆多活動和狂熱思索的焦點。XML 只是基於普通文本,但卻提供了幾乎可以在任何兩個應用程序間共享數據的方式。

       雖然 XML 在概念上很簡單,但對 XML 的處理卻通常很煩瑣(需要編寫大量重複性的代碼)和複雜(很多容易被忽視的細節導致錯誤)。     

什麼時候使用 XML?

       什麼時候在Web 應用程序中使用 XML?

  • 你需要處理已經保存在 XML 中的數據時。
  • 你希望用 XML 保存數據併爲將來可能的整合做準備時。(XML 在應用程序整合的場景中最有意義)
  • 你希望使用依賴於 XML 的技術時。(Web 服務使用各種建立在 XML 上的標準)
  • 註解:
  •        必須理解的一個重要概念是,存儲數據時必須決定兩件事情:
  • 確定數據結構化的方式(邏輯格式)
  • 確定數據保存的方式(物理存儲)

       XML 是格式的選擇而不是存儲的選擇。也就是說,即使你決定用 XML 保存數據,你還要決定是保存到數據庫字段裏,還是要插入到一個文件裏,或者只是以字符串或其他對象的形式保存在內存中。

XML 簡介

       XML 規範是由 W3C(World Wide Web Consortium)定義的一組指南,用於以純文本的形式描述結構化數據,一種基於尖括號間標籤的標記語言。

       XML 沒有一組固定的標籤。相反,XML 是一種可用於創建其他標記語言的元語言。

       下面的文檔顯示一個保存產品類別的自定義 XML 格式:

<?xml version="1.0" encoding="utf-8" ?>
<productCatalog>
 <catalogName>Acme Fall 2015 Catalog</catalogName>
 <expiryDate>2015-01-01</expiryDate>
 <products>
  <product id="1001">
   <productName>Magic Ring</productName>
   <productPrice>342.10</productPrice>
   <inStock>true</inStock>
  </product>
  <product id="1002">
   <productName>Flying Carpet</productName>
   <productPrice>982.99</productPrice>
   <inStock>true</inStock>
  </product>
 </products>
</productCatalog>

       標籤可以自由使用最能描述你的數據的任意名稱,正是這種靈活性使得 XML 非常成功。當然,靈活性也會有缺點。不同公司完全可用不同的標籤名來描述相似的數據,儘管所有應用程序都能夠解析 XML 數據,但數據的寫入者和讀取者需要對標籤和結構達成共識,才能使讀取者可用解釋數據並抽取有意義的信息。 

XML 的優點

       今天,XML 比過去任何一天都更爲有用。現代應用程序使用 XML 的好處有以下幾點:

  • 適應性。XML 無處不在,無論什麼時候需要共享數據,XML 都會成爲首選目標。
  • 擴展性和靈活性。XML 不會強加任何數據語義的規則,適用於任意數據的類型並且實現的代價很低。
  • 相關標準和工具。XML 成功的另一個原因在於創建和處理 XML 的工具(解析器)和相關標準(XML架構、XPath、XSLT)。這樣幾乎每種語言的開發者都有現成的組件用於閱讀 XML,按某種規則(被稱作架構)驗證 XML 的有效性,將 XML 轉換格式等。 

格式良好的 XML

       XML 是一個非常嚴格的標準,這種嚴格性是用於保留廣泛的兼容性的。(臭名昭著的 HTML 語言就是在沒有這種嚴格性標準下的產物)

       所有的 XML 解析器都會執行一些基本的質量檢查。如果一個 XML 文檔不能滿足所有標準,它就會被徹底拒絕。否則,它就被認爲是格式良好的。格式良好的 XML 未必就是正確的 XML ,例如含有錯誤數據,但 XML 解析器能夠解析它。

       XML 文檔必須滿足下面這些條件才能被認爲是格式良好的:

  • 每個開始標籤必須有一個對應的結束標籤
  • 空元素必須以“/>”結束
  • 元素可以嵌套但不能交錯
  • XML 是嚴格區分大小寫的,因此 <FirstName> 和 </firstName > 不能配對
  • 一個元素不能有兩個或更多的同名特性,但是可以嵌套多個同名的元素
  • 一個文檔只可以有一個根元素
  • 所有特性在值的前後都要有引號
  • 註釋不能放入標籤中(它們包含在 <!-- 和  --> 標記中) 

XML 命名空間

       隨着 XML 標準的成長,已創建了數十種 XML 標記語言(通常叫做 XML 語法)。其中很多屬於特定的行業、流程和信息類型。如果你需要同時組合兩個具有相同名稱元素的 XML 語法,會發生什麼呢?另一個更典型的問題是如何區分它們?

       解決辦法在於 XML 命名空間標準。這個標準的核心思想是所有的 XML 標記語言都擁有能夠唯一區分相關元素的命名空間。簡單的說,命名空間可以在整合時消除同名元素的歧義。

       所有的 XML 命名空間都使用 URI(Universal Resource Identifiers,統一資源標識符),一般看起來和網頁的 URL 相似。例如,http://www.mycompany.com/mystandard 是一種典型的命名空間,但這不是必要的(也不應該被假設),命名空間可以是任意文本序列,標準是爲了確保它的唯一性。

       要指定某個元素屬於特定的命名空間,只需在開始標籤中加入 xmlns(XML Name Space)特性表明要使用的命名空間即可。例如,下面這個元素是http://mycompany/OrderML 命名空間的一部分。

<order xmlns="http://mycompany/OrderML"></order>
    你一定會厭倦在所有元素上加入這個特性的煩瑣操作,幸好,如果像下面這樣加入命名空間,它會成爲所有子元素默認的命名空間:
<product xmlns="http://mycompany/OrderML">
 <productName>Flying Carpet</productName>
 <productPrice>982.99</productPrice>
 <inStock>true</inStock>
</product>
    你還可以自定義命名空間前綴,在 xmlns 特性中插入一個冒號和一個你想用作前綴的字符:
<ord:order xmlns:ord="http://mycompany/OrderML"
      xmlns:cli="http://mycompany/ClientML">
 <cli:client>
  <cli:firstName>...</cli:firstName>
  <cli:lastName>...</cli:lastName>
 </cli:client>
 <ord:orderItem>...</ord:orderItem>
 <ord:orderItem>...</ord:orderItem>
</ord:order>

XML 架構

       XML 的靈活性也帶來了一些問題。世界各地的開發人員都使用你的 XML 格式,怎樣才能保證所有人都遵守規則?

       解決辦法是創建一個格式文檔,它定義你的自定義標記語言的規則,它被稱爲架構。這些規則不會包括語法細節(那是 XML 標準所要規定的),架構文檔需要定義的是符合你的數據類型的邏輯規則,它包括以下幾項:

  • 文檔詞彙。它定義了哪些元素或特性的名字可以出現在你的 XML 文檔中。
  • 文檔結構。它定義了標籤放在哪兒,可以指定標籤之間的順序,還可以指定某個元素可以出現的次數。
  • 支持的數據類型。可以定義數據是文本,或者必須是可以解析的數值數據、日期信息等。
  • 允許的數據範圍。可將數值限制在範圍內,文本限定在特定長度內,強迫正則表達式模式匹配,或者限制僅可以是某些特定的值。

       下面的這個 XML 架構定義了前面所示的產品類別規則:

<?xml version="1.0" encoding="utf-8"?>
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
 <xsd:element name="productCatalog">
  <xsd:complexType>
   <xsd:sequence>
    <xsd:element name="CatalogName" type="xsd:string" />
    <xsd:element name="expiryDate" type="xsd:date" />
    <xsd:element name="products">
     <xsd:complexType>
      <xsd:sequence>
       <xsd:element name="product" type="productType" maxOccurs="unbounded" />
      </xsd:sequence>
     </xsd:complexType>
    </xsd:element>
   </xsd:sequence>
  </xsd:complexType>
 </xsd:element>
 <xsd:complexType name="productType">
  <xsd:sequence>
   <xsd:element name="productName" type="xsd:string" />
   <xsd:element name="productPrice" type="xsd:decimal" />
   <xsd:element name ="inStock" type="xsd:boolean" />
  </xsd:sequence>
  <xsd:attribute name="id" type="xsd:integer" use="required" />
 </xsd:complexType>
</xsd:schema>
  • 所有的架構文檔都是以根元素 <schema> 開頭的 XML 文檔
  • 所有可用的元素都已經在 XML 架構空間定義了(http://www.w3.org/2001/XMLSchema
  • 你的架構文檔必須使用正確的命名空間名(前綴一般是 xsd 或 xs ,你也可以自定義)
  • 在 <schema> 元素內,有兩種類型的定義
  • <element> 定義目標文檔必須遵循的結構
  • <complexType> 定義文檔結構較小的數據結構
  • <element>標籤是架構的核心,同時它也是所有驗證的起點

       在這個示例中,<element>標籤確定產品類別必須以一個叫做<productCatalog>的根元素開始。<productCatalog>元素內部是一個由3個元素組成的序列。第一個是<catalogName>,它包含普通文本;第二個是<expiryDate>,它包含符合日期呈現規則的文本;第三個是<products>,它包含<product>元素的列表。

       每個<product>元素都是一個複雜的類型,因此文檔後面又使用<complexType>進行了定義。這個複雜類型(名爲<productType>)由含有產品信息的 3 個元素所組成的序列構成。這些元素分別保存文本(<productName>)、十進制數(<productPrice>)、布爾值(<inStock>)。這個複雜類型還包括一個必須的特性 id。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章