XML的第一课

 

XML,呵呵新接触的。以前也听过XML,但不是很了解。第一章今天也学完了,也对XML有了一点的了解,下来我也谈谈“XML”呵呵。主要是第一章XML的概述和DTD技术。如果那里有错误,希望朋友们帮我指出来。也让我学习学习。不废话了,进入正题XML·

    一·   什么是XML 和XML 的产生

  XML英文缩写(eXtensible Markup Language)意思是可扩展的标记语言,它是标准通用标记语言。

XML是一套定义语义标记的规则。XML是创建标记语言的元语言。XML有两个先驱。-SGML和HTML这两个都是很成功的标记语言。SGML也是可以创建标记的语言。 SGML在web发明之前早已存在的使用标记来描述文档资料的通用语言。它是一种定义标记语言的元语言。

 1998年2月 W3C发布了XML1.0的标准期末的是为了在WEB上能以现有的超文本表就语言(HTML)
 的使用提供和接收处理通用的SGML。XML是SGML的一个简化子集。它是一种开放的。自我描述
的方式定义了数据结构。在描述数据内容的同时能突出对结构的描述。从而体现出数据与数据之间的关系。

 W3C是万维网联盟。 应为缩写是 World wide web Consortium 成立于1994-10 以开放论坛
 的方式来促进开发互通技术,开发网络全部潜能。之成立以来发布了90多份WEB技术规范。领导着WEB技术方向发展。

 

二   XML的特点

1  XML允许各种不同专业开发与自己的特定领域有关的标记语言。

2  XML具有较好的保值性。

3  应用间数据交换。

 

三 XML文档的编写。

  下来就进入到了XML的文档部分。如果你现在不明白什么是XML文档。就在网上找一段完整的XML代码。然后保存为AA.XML打开这个就是XML文档。呵呵。

 XML的文档结构。从逻辑上说,文档组成部分可以分为。元素、注释、声明、字符引用和文档定义或处理指令。

一个零良好的XML包括这三个部分。

下面是XML文档元素。

<student>

<name>Tom</name>

<age>28</age>

</student>

  标记是XML的精髓。 XML对文档的格式要求非常严格,HTML文档格式非常松散,导致了HTML文档解析的复杂性。也造成了浏览器兼容问题。所以XML从一开始。就对文档格式制订了非常严格的标准。

XML文档使用标记的规范:

  1  大小写有所区分。

  2  开始标签必须要有一个结束标签。

  3   所有的标记要正确嵌套。

  4   所有标签的属性必须要用双引号或者单引号括起来。

如:  <商品 类型=“服装” 颜色=“黄色“>

  类型和颜色是标记商品的属性。  服装是类型的值。黄色是颜色的值。

刚才说了XML文档从逻辑上有5部分组成,现在我简单聊下。

 1 XML的声明

  <?xml version="1.0" encoding="utf-8" standalone="yes" ?>

2  XML类型声明。

当你把你的XML文档给别人别人怎么知道你XML声明的标签是声明?所以可以用DTD规范XML文档。

3   元素

  XML中元素由开始和结束标签构成。对于空元素。有空元素的构成。

  元素是XML文件的基本单元。其形式为<标记>数据内容</标记>

  元素的命名要注意几点。

  ·  名称只能以字母。下划线。或者冒号(建议不要使用冒号。这个和名称命名空间用于分割名称空间前缀。和本地部分。有所冲突。所以慎用。)开头。
  · 名称中可以包含字母。数字,下午先以及在XML标准中允许使用的字符。
  · 名称中不能包含空格。
 4   注释

 注释和HTML注释一样<!--注释内容-->
 5   处理指令。

下来谈谈XML里面的预定义实体。

 如果你XML文档里面需要出现<  > & "  '怎么办?而这些标记XML被留用在标记的命名空间里。那你输入不是会冲突。所以有了预定义实体。 < 可以用&lt;   > 可以用&gt;  &可以用&amp; "可以用 &quot;  '可以用&apos;  如:<remark value="Dont't open the door">可以写成<remark value=" Dont&apos;t ...">

 

三  DTD

 一个 "有效的"文件首先应该是"形式良好"的。但是这是远远不够得。他还要往前更进一步。

所以出现了DTD规范XML的标规定。XML文件必须遵循文件类型DTD。

 

DTD分为内部DTD和外部DTD

1  内部DTD 很简单。就是在XML文件的序言处加入一个DTD描述。加入位置要紧接在XML处理指令之后。

如:  <?xml version="1.0" encoding="utf-8" standalone="yes" ?>

     <?DOCTYPE 根元素名[

     元素描述

     ]>

文件体。。。

 

 呵呵,很简单吧。但是如果每个XML文件都要定义这样一段DTD那不是很繁琐。所以出现了外部DTD

 

2  外部DTD

   DTD里面的属性类型:
   CDATA 最通常的一种属性类型。表明属性为字符数据。它和元素内容中的的#PCDATA是一样的。
   Enumerated在声明属性时。可以限制树形的取值只能从一个列表中选择。这类属性属于枚举类型。
  <!ATTLIST person sex(male|feamale) # REQUIRED>
   ID ,IDREF,IDREFS
   ID类型的属性唯一标示XML文档中的元素。
   IDREF 类型的属性值为同一文档中泪一个元素的ID类型的属性值。而这个另一个元素的属性值是必须存在的。
   ENTITY 类型属性是把外部的二进制数据连接到文档。
   ENTITY 类型的属性值是在DTD中声明的为分析的一般实体名称。外部DTD的好处就是:他可以方便高效的被多个XML文件所共享。

  属性里面的一些缺省值:

  必须赋值的属性:REQUIRED

  属性值可有可无得属性:IMPLIED

  固定取值的属性:FIXED

  定义缺省值的属性:默认

带参数的实体

<!ENTITY % 实体名 SYSTEM "外部文件名">引用方式为:

 %实体名  这样就可以了。

什么是有效的XML

   ·一个遵守XML语法规则。并遵守相相应的DTD文件约束的XML文档称为的XML文档。
  · 注意区分格式良好的XML和有效的XML。一个只遵循XML规范。一个不但要遵循的XML规范。还要遵循相应的DTD约束。

 

下来简单说下 XML  HTML  和SGML的关系
    SGML 是一种在web发明之前早已存在的使用标记来描述文档资料的通用语言。它是一种定义标记语言的元语言。HTML和XML都是从SGML发展而来的标记语言。因此,它们有一些共同特点。如。相识的语法和标记的使用。XML是sgml的一个简化版本,是SGML的一个子集。严格意义上说。XML仍然是SGML
   HTML不能用来定义新的应用。而XML可以。例如:RDF和CDF都是XML定义的应用。SGML比较复杂。而XML得设计出发点是SGML的优点。去掉复杂的部分。保持轻巧。使得可以在WEB上工作。
  HTML.SGML 和XML 讲继续用于其适合的地方。它们中的任何一个都不会使得其他一个废弃。如果数据要长期使用,并且需要更多的一些结构。那使用XML是最好不过的了。

 

呵呵,写完这些都用了2个小时了。呵呵。写一遍收获也不少。我也要每天坚持了。呵呵。大家一起进步。瞌睡了。该睡觉了··

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章