1.XML詳解:
XML:可擴展標記語言,XML是互聯網數據傳輸的重要工具,他可以跨越互聯網任何技術的平臺,不受編程語言和操作系統的限制。
作用:XML有助於在服務器或者WEB之間穿梭結構化數據,處理結構化文檔信息。
結構:標記數據,定義數據類型,允許用戶對自己的標記語言進行定義的源語言。
2.XML作用及其特點:
2、xml的特點及作用
XML與操作系統,編程語言的開發平臺都無關,可以實現不同操作系統之間的數據交互。(雁聯的客戶端和服務器就是通過XML進行報文解析。)
主要作用:配置應用程序和網站
數據交互。
AJax基石。(Ajax是現在目前比較流行的一個網絡交互的技術。Ajax裏面最後一個x實際上就是xml的縮寫。Xml(Extensible Markup Language)是可擴展標記語言)
3.XML格式:
<?xml version="1.0"?> //XML文檔的聲明 聲明由version和encoding組成。version爲文檔符合XML1.0格式規範。encoding默認編碼爲UTF-8;
<books> //第一個節點爲根節點,也爲開始標籤,在XML最後一行必須有一個結束標籤。根節點只有一個。
<!---圖書館-->
<book id="bk101">
<author>王珊</author> //author爲元素。開始標籤+內容+結束標籤
<tittle>.NET</tittle> //元素
<description>包含C#框架和網絡編程等</description>
</book>
<book id ="bk102">
<author>李明明<author>
<tittle>XML基礎編程</tittle>
<description>包含XML基礎概念和基本用法</description>
</book>
</books>
3、xml聲明
例子:
注:xml聲明一般是xml文檔的第一行;xml聲明由以下幾個部分組成:
4、根元素
它是xml文檔裏面唯一的;它的開始是放在最前面,結束是放在最後面。
5、元素:
(1) 所有的xml元素都必須有結束標籤;
(2) xml標籤對大小寫敏感;
(3) xml必須正確地嵌套;
(4)元素的命名規則:
名稱中可以包含字母、數字或者其他的字符;
名稱不能以數字或者標點符號開始;
名稱中不能包含空格。
(5)空元素
6、屬性
(1)語法
<元素名 屬性名=“屬性值”/>
例:<Student ID=“S100”>
<Name>Tom</Name>
</Student>
(2)注意:
屬性值用雙引號包裹;一個元素可以有多個屬性,它的基本格式爲:
<元素名 屬性名=“屬性值” 屬性名=“屬性值”>;
屬性值中不能夠直接包含<.”,&。
7、實體:
在xml中,一些字符擁有特殊的意義。如果把字符“<”放在xml元素中,會發生錯誤,這是因爲解析器會把它當作新元素的開始,這樣會產生xml錯誤:
爲了避免這個錯誤,請用實體引用來代替“<”字符:
xml中5個預定義實體
8、註釋
注:註釋內容中不要出現”--”;不要把註釋放在標籤中間;註釋不能嵌套。
9、總結:
(1)xml描述的是文檔的內容與語義,而不是文檔應當如何顯示;
(2)格式正規(well formed)的xml文檔
遵循如下規則的xml文檔稱爲格式正規的xml文檔:
v 必須有xml聲明語句;
v 必須有且僅有一個根元素;
v 標籤大小寫敏感;
v 屬性值用雙引號;
v 標籤成對;
v 空標籤關閉;
v 元素正確嵌套。
(3)有效的(valid)xml文檔。首先xml文檔是個格式正規的xml文檔,然後又需要滿足DTD的要求,這樣的xml文檔稱爲有效的xml文檔;
10、解析器
11、命名空間
11.1、xml命名空間(xml Namespaces)
(1)xml命名空間提供避免元素命名衝突的方法。
(2)在xml中,元素名稱是由開發者定義的,當兩個不同的文檔使用相同的元素名時,就會發生命名衝突。
11.2、xml命名空間示例
(1)使用前綴示例
與僅僅使用前綴不同,我們爲標籤添加了一個xmlns屬性,這樣就爲前綴賦予了一個與某個命名空間相關聯的限定名稱。
二、DTD技術——xml文件的驗證機制
1、DTD概述:
文檔類型定義——Document Type Definition
DTD用來描述xml文檔的結構,一個DTD文檔包含:
元素的定義規則;元素之間的關係規則;屬性的定義規則。
2、爲什麼要用DTD呀
v 有了DTD,每個xml文件可以攜帶一個自身格式的描述,所謂格式描述就是我的xml文檔裏面可以寫哪些東西,比如元素、屬性;
v 有了DTD,不同組織的人可以使用一個通用DTD用來交換數據,xml是隨意定義的,有了DTD,我們可以限制多個公司之間按照這種DTD的規則來編寫xml文檔,由於DTD都是統一格式,所以不同的公司之間,不同的組織之間就可以用這種通用的xml文檔格式進行交互數據了;
v 應用程序可以使用一個標準DTD校檢從外部接收的xml數據是否有效。
3、如何編寫一個DTD
DTD分成三大類,第一是內部DTD,第二是外部DTD,第三是內外結合的DTD。
(1)內部DTD文檔(Students.xml):
(2)就是說這個xml文檔裏面既包含xml定義,又包含DTD的定義。
這個[]裏面是DTD的定義的內容,就是第一個叫內部DTD文檔。
(3)外部DTD文檔(Students.xml Students.dtd):
所謂外部就是DTD的定義和我們的xml文檔是在不同的文件裏面。
那麼外部的DTD如何使用呢?那就需要在前面的xml文檔的根元素的上面這個位置跟剛纔內部的是一樣的,要寫上
這類年改革文檔在同一個文件夾下面,就可以了。
有內部DTD了,爲什麼還要學習外部DTD呢??
內部的DTD,它只能驗證當前的這個xml文檔。那假如說,我們有一個DTD需要驗證多個xml文檔的話,那就直接使用外部DTD就行。
(4)內外部DTD文檔結合
4、DTD的具體定義——元素的定義
元素名稱:是指xml文檔裏面的元素名稱
元素類型:
(1)EMPTY
示例第一個是對的,第二個是錯誤的,因爲它有內容了。
(2)#PCDATA
第一個是對的,第二個是錯誤的。
(3)純元素類型的DTD語法
(4)ANY
5、定義屬性的語法結構
xml文檔攜帶數據的方式,不僅僅是xml的元素的內容,還可以是元素的屬性。
所以說在DTD裏面我們有必要對屬性進行限制。
(1)編寫屬性驗證的語法規則:
(2)屬性類型——CDATA
CDATA是表示屬性的值,可以是任何字符,這裏包括數字和中文。
問題一:屬性的CDATA與元素的CDATA節有何區別呢??
屬性的CDATA表示屬性值是任何的字符,元素裏的CDATA節是表示在CDATA節裏面的內容不被xml文檔進行解析。
問題二:#PCDATA與CDATA有何區別??
#PCDATA是限制元素裏面的內容是字符類型的,而這個CDATA是限制屬性裏面的內容是字符類型。
(3)屬性類型——ID
表明該屬性的取值必須是唯一的。
(4)屬性類型——IDREF/IDREFS
v IDREF是指它的值要指向文檔當中其它地方聲明的ID。把IDREF當成數據庫的外鍵,把ID當成主鍵理解就行;
v IDREFS同IDREF,但是可以具有由空格分開的多個引用;
(5)屬性類型——Enumerated
預先定義了一些值,屬性的值必須在所列出的值的範圍內
(6)屬性特點——#REQUIRED
它表示元素的所有的實例都必須有該屬性的值(NOT NULL)
(7)屬性特點——#IMPLIED
這就表示該屬性的值是可以被忽略的。
(8)屬性特點——#FIXED
元素中該屬性的值必須爲指定的固定值。
(9)屬性特點——Default
爲屬性提供一個默認的值。
三、實體
1、實體概述
實體,簡單理解就是C#中的常量,我們在DTD裏面定義,在xml文檔裏面去使用。(實際上就是自定義實體,與前面的預定義實體差不多是一回事)。
2、實體的定義
四、xml之Schema技術
1、Schema概述:xml Schema是用一套預先規定的xml元素和屬性創建的,這些元素和屬性定義了xml文檔的結構和內容模式。Xml Shema規定xml文檔實例的結構和每個元素/屬性的數據類型。
理解:對於Schema來講,我們可以將shema比喻成爲是表結構。在表結構裏,定義一些數據的限制要求。然後我們xml文檔呢就相當於是數據表將來要存儲的數據u,也就是數據庫裏面的數據表數據了,所以整體來講的話schema它就是用於驗證xml文檔的。
2、有了DTD,爲什麼要用Schema呢?
(1)DTD的侷限性
DTD不遵守xml語法(寫xml文檔實例時用一種語法,寫DTD的時候用另外一種語法);DTD數據類型有限(與數據庫數據類型不一致);DTD不可擴展;DTD不支持命名空間(命名衝突)。
(2)Schema的新特性
Shema基於xml語法的;Shema可以用能處理xml文檔的工具處理;Schema大大擴充了數據類型,可以自定義數據類型;Schema支持元素的繼承——Object-Oriented;Shema支持屬性組。
3、Shema(模式):其作用與DTD一樣,也是用於驗證xml文檔的有效性,只不過它提供了比DTD更強大的功能和更細粒度的數據類型,另外Schema還可以自定義數據類型。此外,Schema也是一個xml文件,而DTD則不是。
4、所有的Schema文檔,其根元素必須爲Schema。
5、Schema的文檔結構
6、Schema的數據類型
6.1、Schema的數據類型概述
6.2、簡單類型:
(1)內置的數據類型:
基本的數據類型;
擴展的數據類型;
(2)用戶自定義簡單類型(通過simpleType定義)。
6.3、複合類型(通過complexType定義)
6.4、數據類型的特徵
7、Schema的元素類型
7.1、Schema根元素
作用:包含已經定義的Schema
用法:<xs:schema>
屬性:xmlns/targetNamespace/elementFormDefault
例子:
7.2、element元素
作用:聲明一個元素
屬性:name/type/ref/minOccurs/maxOccurs
例子:
7.3、group元素
作用:把一組元素聲明組合在一起
屬性:name
例子:
7.4、attribute元素
作用:聲明一個屬性
屬性:name/type/use/default/fixed
例子:
7.5、attributeGroup元素
作用:把一組屬性聲明組合在一起
屬性:name/ref
例子:
7.6、simpleType元素
作用:定義一個簡單類型,它決定了元素和屬性值的約束和相關信息
屬性:name
常用的兩種方式:restriction——>一個約束;list——>從列表中選擇。
(1)simpleType元素的子元素——>restriction
子元素爲:<xs:restriction>——>定義一個約束條件
例子:
(2)simpleType元素的子元素——>list
子元素爲:<xs:list>——>從一個特定數據類型的集合中選擇定義一個簡單類型元素。
例子:
7.7、complexType元素
作用:定義一個複合類型,它決定了一組元素和屬性值的約束和相關信息。
屬性:name
常用的兩種方式:sequence——>一個序列;choice——>設置選擇項。
(1)complexType元素——sequence
作用:給一組元素一個特定的序列
例子:
(2)complexType元素——choice
作用:把一組屬性聲明組合在一起,以便可以被複合類型應用
屬性:name/ref
例子:
7.8、complexType與simpleType區別
simpleType類型的元素中不能包含元素或者屬性;
當需要聲明一個元素的子元素和或屬性時,用complexType;
當需要基於內置的基本數據類型定義一個新的數據類型時,用simpleType。