曝光台 注意防骗
网曝天猫店富美金盛家居专营店坑蒙拐骗欺诈消费者
些令人头疼的区别);此外,Internet Exploer 5.0 和Mozilla 5.0 能很好支持可以同时用于XML 和HTML 的大部分CSS Level
1 的内容和一些CSS Level 2 的内容。因此,选择CSS 会与更广泛的浏览器相互兼容。
另外,CSS 更成熟一些,CSS Level 1(包含目前为止我们已经看到的大部分CSS 内容)和CSS Level 2 是W3C 的推荐规范。
XSL 仍然是一个早期的工作草案,而且直到本书出版后也不会最终定型。早期的XSL 采纳者曾经接受过考验,而且将在形式
统一的标准之前接受再一次的考验。选择CSS 意味着无须为了追随软件和标准的发展不停地重写自己的样式单。但是,XSL
将最终形成一个可用的标准。
因为XSL 是一种新事物,不同的软件实现方式不同,实现的是草案标准的不同的子集。在写作本书的1999 年春天至少有三
种主要不同形式的XSL 在广泛应用,到本书出版前将会有更多。如果当前浏览器中不完善的CSS 操作已经让人头疼的话,那
么众多的XSL 变种就会使人发疯。
但是,XSL 的功能很明显比CSS 强大。CSS 仅允许格式化元素内容,不允许改变或重新安排这些内容,必须根据元素的内容
或属性为元素选择不同的格式化方式或者增添诸如署名之类简单、额外的文本。XSL 非常适用于XML 文档仅包含最少的数据,
并且数据周围没有HTML 装饰的情况。
使用XSL 能够从页面上分离出关键数据,如刊头、向导栏和署名等。使用CSS 不得不在数据文档中包含全部这些项目。XML+XSL
允许数据文档与Web 页面文档分离单独存在,从而使得XML+XSL 文档更容易维护和处理。
XSL 终将成为现实世界和大量数据应用的最佳选择,CSS 更适合于简单的页面,如祖母用于向她们孙子寄送图片的页面。但
对于这些用途,HTML 已经足够。如果使用HTML 行不通,XML+CSS 不会有多大的帮助。相较而言,XML+XSL 能够解决更多HTML
不能解决的困难。对于传统的浏览器来说,仍然需要CSS,但长远看来使用XSL 才是发展方向。
XML 实用大全
第 129 页
5.5 本章小结
在本章中,读者看到了从头创建的XML 文档的示例。特别是学到如下内容:
• 信息可以保存在元素的属性中。
• 属性是包含在元素起始标记中的一个名字-数值对。
• 属性主要用来保存关于元素的元信息,而不是元素的数据。
• 属性比元素内容更不便处理。
• 对于非常简单并且不随文档改变其形式的信息,使用属性较好。特别是样式信息和链接信息,作为属性执行起来很
顺利。
• 空标记给没有内容的元素提供了句法修饰。
• XSL 是一种功能强大的样式单语言,使我们能够访问和显示属性数据和转换文档。
下一章将详细介绍结构完整的XML 文档必须严格遵循的规则。我们还将研究另外一些在XML 文档中嵌入信息如注释和处理命
令的方法。
XML 实用大全
第 130 页
第6 章 结构完整的XML 文档
HTML 4.0 有大约100 个不同的标记,大部分标记都有多个可能的属性用于几百种不同的变化。因为XML 的功能比HTML 强大,
你也许认为需要懂得更多标记,但不是这样。XML 凭借其简洁性和可扩展性具有强大的功能,并不是大量的标记。
事实上,XML 几乎没有预先定义任何标记,相反允许用户在需要时定义自己的标记。但是由自定义标记建立的这些标记和文
档并不是随意的,必须遵循一组特定的规则,本章将详细阐述这些规则。遵守这些规则的文档被认为是结构完整的。结构完
整是XML 处理器和浏览器阅读文件必要的最起码的标准。本章将阐述用于结构完整的XML 和HTML 文档的规则。请特别注意
XML 与HTML 的区别。
本章的主要内容包括:
• XML 文档的组成
• 置标和字符数据
• 独立文档中的结构完整的XML
• 结构完整的HTML
6.1 XML 文档的组成
XML 文档包含由XML 标记和字符数据组成的文本。它是一个有固定长度的有序字节的集合,并遵守特定的约束。它可能是或
者不是一个文件。例如,XML 文档可能:
• 存储在数据库中
• 由CGI 程序在内存中瞬间创建的
• 由几个相互嵌套的不同文件组合而成
• 不存在于自身的文件中
但是如果把一个XML 文档看作一个文件也是可以的,只要记住它可能并不是存在于硬盘上的真实文件。
XML 由称为“实体”的存储单元组成,每个实体包含文本或者二进制数据,但不能同时存在。文本数据由字符组成,二进制
数据用于图片和小程序等类内容。用一个具体的示例说明就是,一个含有<IMG>标记的原始HTML 文件是一个实体而不是文档。
一个HTML 文件加上所有使用<IMG>标记嵌入的图片就组成一个文档。
在本章和后续几章中我们只针对由一个实体构成的简单的XML 文档,即文档本身。而且这些文档只包含文本数据,不包含诸
如图片小程序一类的二进制数据。这些文档能够完全独立被理解而无需读取其他文件。换句话说,它们是独立存在的。这种
文档通常在它的XML 标头中含有一个值为yes 的standalone 属性,如下所示:
<?xml version="1.0" standalone="yes"?
外部实体和实体引用用于组合多个文件和其他数据源以创建一个独立的XML 文档。这样的文档如果不引用其他文件就不能进
行句法分析。这些文档通常在XML 声明中含有一个属性值为no 的standalone 属性:
<?xml version="1.0" standalone="no"?>
外部实体及实体引用将在第9 章“实体与外部DTD 子集”中讨论。
XML 实用大全
第 131 页
6.2 置标和字符数据
XML 文档是文本。文本由字符组成。字符是字母、数字、标点符号、空格、制表符号或类似的东西。XML 使用Unicode 字符
集(统一的字符编码标准集),它不仅包含来自英语和其他西欧字母表中的常见字母和符号,也包含来自古斯拉夫语、希腊
语、希伯来语、阿拉伯语和梵语的字母表。另外还包含汉语和日语的象形汉字和韩国的Hangul 音节表。在本章中只使用英
中国航空网 www.aero.cn
航空翻译 www.aviation.cn
本文链接地址:
XML实用大全(41)