深入體驗Java Web開發內幕-核心基礎(看張孝祥的書的筆記一)

 一、XML基礎

1、XML作爲一種通用的數據交換格式,應用越來越廣泛。目前許多系統的配置文件都是使用XML格式。配置文件就是記錄應用程序的配置信息的文件。比如,某個程序要連接網絡上的數據庫系統時,需要指定數據庫服務器的IP地址、服務器的網絡監聽端口號、數據庫的名稱、用戶名和密碼等信息,這些信息可以作爲應用程序的配置信息來對待,即不要將這些信息寫死在源程序中,而是寫在一個文本文件中。應用程序要連接數據庫系統時,從該文本文件中讀取所需要的信息,如果連接的數據庫系統的信息發生了改變,則只需要修改文本文件,而不用修改源程序,這個文本文件就是應用程序的配置文件。傳統的配置文件通常採用如下格式:

                             #DB.properties

                              DBServer=192.168.0.100

                               port=1443

                               Database=emp

                               Username=abc

                               Password=123

上面這種格式的配置文件只能表述一些簡單的信息,而很難表達具有層次結構和數據項目要動態增加的信息。採用XML格式的配置文件很容易表達這種層次結構。因此,要深入學習和掌握Java Web開發技術,必須有一些基本的XML語言知識。

2、在一個完整的XML文檔中必須包含一個XML文檔聲明,該聲明必須位於文檔的第一行。這個聲明表示該文檔是一個XML文檔,以及遵循的是哪個XML版本的規範。最簡單的XML文檔聲明語法如下:

                     <?xml version="1.0" ?>

在“<”和“?”之間、“?”和“>”之間以及第一個“?”和XML之間不能有空格,這就是XML語法嚴格性的一個體現。聲明語句中的version屬性表示XML的版本,因爲解析器對不同的版本的解析肯定會有區別,儘管目前只有1.0版本,但在聲明中必須指定version屬性。因爲可以採用不同的字符編碼集來書寫一個字符內容完全相同的XML文檔,所以XML軟件工具(包括分析器)就需要知道該XML文檔所使用的字符編碼方式。這可以通過在XML文檔聲明中指定encoding屬性來說明,比如,使用下面的語句來指明文檔中的字符編碼方式爲GB2312編碼

                   <?xml version="1.0" encoding="gb2312" ?>

W3C的XML1.0規範裏規定,所有的XML解析器必須接受UTF-8和UTF-16編碼的Unicode字符,所以,符合XML規範的軟件工具一定都支持這兩種Unicode編碼。如果XML聲明中沒有設置encoding屬性來明確指定文檔所用的字符編碼方式,則一律以Unicode編碼看待。XML解析器通過尋找XML文檔開始處的字節順序標記,能夠自動檢測出文檔中的Unicode編碼是UFT-8還是UTF-16。XML文檔聲明語句中,還可以指定另外一個可選的屬性:standalone,例如:

                  <?xml version="1.0" encoding="UTF-8" standalone="yes" ?>

standalone屬性用來說明文檔是否是獨立的,如果將其設置爲"yes",則表示該文檔沒有依賴外面的任何文件而可以獨立存在,即不需要DTD文件來驗證其中的標識是否有效,也不需要XSL、CSS文件來控制其顯示外觀;standalone屬性的默認值爲“yes”。注意:如果同時設置了encoding和standalone屬性,standalone屬性要位於encoding屬性之後,對於還有中文字符的XML,其中的字符可以採用Unicode來編碼或GB2312(簡體中文字符編碼)編碼來表示。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章