• 热门标签

当前位置: 主页 > 航空资料 > 计算机 >

时间:2010-08-09 13:16来源:蓝天飞行翻译 作者:admin
曝光台 注意防骗 网曝天猫店富美金盛家居专营店坑蒙拐骗欺诈消费者

Internet RFC 1766,定义语言名称代码的ISO 639,以及定义国家名称代码的ISO 3166)为理解
XML 1.0以及构建处理X M L文档的计算机程序提供了所有必需的信息。
在保证规范完整性和合法性的前提下, XML 1.0规范可以免费发行。
1.2 术语
本规范定义了用于描述X M L文档的术语。在定义X M L文档以及描述X M L处理器的行为时,
我们将用到下列术语:
可以
表示合乎规范的文档和X M L处理器允许出现规范中描述的行为,但是并不强行要求。
必须
表示合乎规范的文档和X M L处理器需要具有规范中描述的行为;否则视为错误。
错误
违反本规范定义的规则;其导致的结果没有明确定义。表示合乎规范的软件可以检测并报
告错误,或者修复错误。
致命错误
X M L处理器必须检测并报告给应用程序的错误。遇到致命错误后,处理器可以继续处理数
据以寻找出更多的错误,并报告给应用程序。为了支持纠错功能,处理器可以根据提供给应用
附录A XML 1.0规范使用813 下载
程序的文档(字符数据与标记的混合体)生成未处理的数据。然而,一旦检测到致命错误,处
理器必须停止正常的处理过程(例如,它不能以常规的方式继续将字符数据和有关文档逻辑结
构的信息传递给应用程序)。
根据用户的选择
表示合乎规范的软件可以或者必须(取决于句子中的情态动词)具备所描述的行为;如果
确实如此,它必须为用户提供允许或禁止该行为的方法。
有效性约束
应用于所有有效的X M L文档的规则。违反有效性约束将导致错误;它们必须根据用户的选
择报告给验证有效性的X M L处理器。
格式正规约束
应用于所有格式正规的X M L文档的规则。违反格式正规约束将产生致命错误。
匹配
(对于字符串或名称:)两个被比较的字符串必须完全相同。对于ISO/IEC 10646定义的可能
有多种表示法的字符(例如:预定义( p r e c o m p o s e d)形式和基字符加变音符形式属于两种不同
的字符形式),仅当它们在两个字符串中具有相同的表示法时,才被认为是匹配的。根据用户的
选择,处理器可以将这些字符规格化为某种规范的形式。不进行字符的大小写转换。(对于字符
串和语法中的规则:)当字符串属于由语法产生式产生的语言时,认为字符串和该语法产生式匹
配。(对于内容和内容模型:)当元素符合“元素有效性”约束中描述的形式时,认为元素与其
声明匹配。
出于兼容性考虑
仅仅是为了保证X M L与S G M L兼容而包含的X M L特征。
出于互操作性考虑
是一个不具约束性的建议,其目的是增加X M L文档能被在ISO 8879的We b S G M L改编附件
(WebSGML Adaptations Annex)之前已有的S G M L处理器处理的可能性。
2. 文档
如果一个数据对象根据本规范的定义被认为是格式正规的,它就可以称为X M L文档。如果
格式正规的X M L文档能够满足进一步的约束条件,它就是有效的。
每个X M L文档都有逻辑结构和物理结构。从物理结构上讲,文档是由被称为实体的单元组
成的。一个实体可以引用其他实体,从而通过这种方式将这些实体也包含到文档中。文档是以
“根”或称文档实体开始的。从逻辑结构上讲,文档是由声明、元素、注释、字符引用和处理指
令构成的,它们均由显式的标记来表示。逻辑结构和物理结构都必须按照“ 4.3.2 格式正规的解
析实体”中描述的要求正确嵌套。
2.1 格式正规的X M L文档
满足以下条件的文本对象被认为是格式正规的X M L文档:
• 从整体上来看,它与d o c u m e n t产生式匹配。
• 它满足本规范定义的所有格式正规约束。
• 文档中直接或间接引用的每个解析实体都是格式正规的。
814使用XML 高级编程
下载
表A - 1
文档
[ 1 ] d o c u m e m t : : = prolog element Misc*
与d o c u m e n t产生式匹配意味着:
• 它包含一个或多个元素。
• 有且只有一个称为根或文档元素的元素,其他所有元素均包含在该元素中。对于其他所
有元素,如果起始标记出现在另一个元素的内容中,则相应的结束标记也必须位于同一
元素中。简而言之,元素是由起始标记和结束标记定界的,各个元素必须正确地嵌套。
因此,对于文档中的任意非根元素C,如果它包含在文档的另一个元素P中,且不包含在P中
的任何其他元素中,则P称为C的父元素,C称为P的子元素。
2.2 字符
解析实体包含文本,文本是由一系列字符构成的,它可以代表标记或字符数据。根据
ISO/IEC 10646 [ISO/IEC 10646]的定义,字符是组成文本的原子单元。制表符、回车、换行,以
及统一码和ISO/IEC 10646 中定义的合法的图形字符都是合法的字符。本规范不提倡使用
[ U n i c o d e ]中6 . 8节定义的“兼容字符”。
表A - 2
字符范围
[ 2 ] C h a r : : = #x9 | #xA | #xD | [#x20- / *除了替代块、F F F E和F F F F
#xD7FF] | [#xE000-#xFFFD] 之外的任何统一码字符。* /
| [#x10000-#x10FFFF]
产生式[ 2 ]是规格化的;实际上,这意味着E u r o(€ €)等新增的统一码字符
在X M L文档中是合法的。
各种实体可能采用不同的字符编码机制。所有X M L处理器必须接受1 0 6 4 6的U T F _ 8和U T F -
1 6编码;我们将在“ 4.3.3 实体中的字符编码”一节讨论如何标识这两种编码,以及如何指定
使用其他编码机制。
2.3 通用语法结构
本节定义了一些常用的语法符号。
S(空白)包含一个或多个空格( # x 2 0)字符、回车、换行或制表符。
表A - 3
空白
[ 3 ] S : : = (#x20 | #x9 | #xD | #xA)+
为了便于使用,字符被分为字母、数字和其他字符。字母可以是字母表中的字母字符,或
者是音节基字符后跟一个或多个组合字符,也可以是表意字符。“B. 字符的分类”一节提供了每
 
中国航空网 www.aero.cn
航空翻译 www.aviation.cn
本文链接地址:XML高级编程下(81)