• 热门标签

当前位置: 主页 > 航空资料 > 计算机 >

时间:2010-08-09 13:05来源:蓝天飞行翻译 作者:admin
曝光台 注意防骗 网曝天猫店富美金盛家居专营店坑蒙拐骗欺诈消费者

前两个例子中,如果开头字母是下划线(例如,“_ 4 2 b o o k”、“_ x m l”或“ _ X M L”),这些命名
就成为合法的了。
现在我们知道了如何按照X M L语法正确地命名,下面来看一看如何使用它们。
2.2 文档部分
一个格式正规的X M L文档由三个部分组成(参见图2 - 2):
• 一个可选的序言(p r o l o g)。
• 文档的主体( b o d y),由一个或多个元素组成,其形式为一个可能也包含字符数据
(character data)的层次树。
• 可选的“鱼龙混杂”的尾声(e p i l o g),其内容包括注释、处理指令( processing instruction,
P I)和/或紧跟元素树后面的空白。
详细信息我们很快就会谈到。
既然数据对象即使没有序言和/或尾声也可以是格式正规的X M L,我们暂时不考虑这些部分
的细节,直到我们已经介绍完所有重要的中间部分—元素和字符数据。
22使用XML 高级编程
下载
图2-2
2.3 元素
元素是X M L标记的基本组成部分。它们可以包含其他的元素、字符数据、字符引用、实体
引用、P I、注释和/或C D ATA部分—这些合在一起被称作元素内容( element content)。(不用
担心这些术语都是什么意思,接下来我们会进行解释。要注意这些元素都是包容器。)所有的
X M L数据(除了注释、P I和空白)都必须包容在其他元素中。
元素使用标记( t a g)进行分隔—由一对尖括号(“< >”)围住元素类型名(一个字符串)。
每一个元素都必须由一个起始标记和一个结束标记分隔开,这与要求比较松的H T M L不同,后者
的结束标记可以省略。这项规则唯一的例外是没有任何内容的元素,即空元素( empty element),
它既可以使用起始标记/结束标记对,也可以使用短小精悍的混合形式—空元素标记。在下面
的章节里,我们会看到许多标记的例子。
元素是XML对内容的包容器—它可以包容字符数据、其他元素以及/或其他标记(注释、
P I、实体引用等等)。既然元素代表的是一些离散的对象,我们可以把它们看作是X M L语
第2章XML 语法使用23
下载
文档
序言
主体
尾声
言中的名词。
下面我们看一看这些标记的细节信息。
2.3.1 起始标记
一个元素开始的分隔符被称作起始标记。起始标记是一个包含在尖括号里的元素类型名。
我们也可以把起始标记看作是“打开”了一个元素,就像我们打开一个文件或通信链路一样。
下面是一些合法的起始标记:
再次强调,由于X M L是大小写敏感的,所以前两个例子不是等同的标记;而且,元素类型
名可以使用任何合法字母,而不一定是A S C I I码字符。
2.3.2 结束标记
一个元素最后的分隔符被称作结束标记。结束标记由一个反斜杠和元素类型名组成,被围
在一对尖括号中。每一个结束标记都必须与一个起始标记相匹配,我们可以把结束标记理解为
关闭了一个由起始标记打开的元素。
下面是一些合法的结束标记,它们与前面列举的起始标记相对应:
所以,带有完整的起始、结束标记的元素应该是如下形式:
<某个标记> 包含的内容< /某个标记>
下面我们简单地了解一下没有内容的元素。
2.3.3 空元素标记
空元素可能不包含任何内容。比如说想准确地指明文档中的某些特定位置(下一节将看到
这样的例子)。我们可以只加入起始标记和结束标记而不在其中包含任何内容:
当然,如果你只是想指定一个点,而不是提供一个包容器,节省些空间可能会更好。所以,
X M L指定空元素可以用缩略形式表示,它是起始和结束标记的混合体。它既短小精悍,而且还
能明确指出该元素既不会有内容,也不允许有内容。
空元素标记由一个元素类型名称紧跟一个反斜杠组成,并围在一对尖括号中。
X M L数据对象可能只包含单个文档元素和一些空元素(可能有属性)!这样的文件可以用
24使用XML 高级编程
下载
于包含程序的配置信息或者C + +对象模板。
2.3.4 标记:一个简单的例子
任何简单的A S C I I文本文件都是非常奇妙的包容器(文件),其中有一系列更小的包容器
(文本行),而其中又顺序排列着字母。从另一种意义上说,文件的物理存在也包容在它的父文
件系统中。但是,在没有一个明确表示“文件开始”的分隔符的同时,文件结束位置经常用一
个特殊控制字母标记出来(例如“ C t r l - Z”或它的十六进制值“ 1 A”)。文本行隐含的开始位置是
它的父文件的物理起始处,但每一个文本行都有一个用回车和/或换行符表示的“行结尾”的分
隔符。
例如,下面是一个基本的A S C I I码文件(注意:行号并不是文件内容的一部分):
程序清单2 - 1
当同样的文本用X M L文档表示时,原本含糊不清的数据结构现在变得清晰明确了(再次说
明,这里的行号并不是文档的一部分):
程序清单2 - 2
在这个例子中,我们显式地表示出整个文件内容的开始和结尾(第1行和第8行),里面每一
个文本行的起始和结束,并包含一个文件尾的标记(第7行)。这是一个表述清晰、可验证的结
构,它由7个元素(其中一个包含其他6个)组成,这些元素用三个不同的元素类型表示
(< t e x t f i l e >、< l i n e >和< E O F / >)。
现在,我们已经知道了元素类型名称的要求以及如何将标记应用在元素中,下面让我们先
暂时停止对元素的讨论,看一看X M L文档的结构。
2.3.5 文档元素
格式正规的X M L文档的定义形式是一个简单的层次树,每个文档都有一个,而且只有一个
根节点,它被称作文档实体( document entity)或文档根( document root)。这个节点可能包含
P I和/或注释,而且总是包含子元素树,它们的根被称作文档元素( document element)。这个元
 
中国航空网 www.aero.cn
航空翻译 www.aviation.cn
本文链接地址:XML高级编程上(11)