本文考察了一些顶尖的 XML 模式,这些模式为各种各样的问题提供了解决方案,从基本的 Web 服务到数据描述等等。其中包括涉及到通讯录和发票的类似数据库的解决方案。本文选择模式的标准是根据其实用性和用途,及其在 XML 信息共享和交换方面对 XML 社区的影响。<!--START RESERVED FOR FUTURE USE INCLUDE FILES--><!-- include java script once we verify teams wants to use this and it will work on dbcs and cyrillic characters --> <!--END RESERVED FOR FUTURE USE INCLUDE FILES-->
|
简单对象访问协议(Simple Object Access Protocol,SOAP)实际上是一种 Web 服务技术,但 Web 服务中客户机和服务器之间的数据交换格式是通过灵活的 XML 模式实现的。
Web 服务的主要优点是客户机和服务器通过网络进行信息和数据交换的互操作性的层次。SOAP 标准使用 XML 以一种体系结构中立的格式来构造数据,定义数据类型和信息。
对于编程语言来说,只需要提供数据类型和需要在远程服务器上调用的函数名称即可。SOAP 库将用主机语言编写的信息和格式转化成 XML 格式的消息,其中包括调用的函数和提供的参数。
通过 W3C 的例子就可以了解 SOAP 的结构。调用远程 SOAP 函数
GetEndorsingBoarder()
的时候,客户机上的调用程序生成清单 1 所示的 XML 消息。
清单 1. 调用远程 SOAP 函数
GetEndorsingBoarder()
|
SOAP 客户机发送的整个消息都放在 SOAP 信封中。信封的内容就是消息的详细内容。
被调用的函数显然是
GetEndorsingBoarder
,它包括两个参数:manufacturer 和 model。由此可见,它把本地的可能采用二进制编码的字符串转化成了 XML 字符串。由于 XML 是平台独立的,主机使用 SOAP 系统不需要复杂的二进制编码和解码就可以交换消息。
服务器通过另一个 XML 编码的 SOAP 信封返回响应,这一次是函数的返回值。SOAP 请求的响应格式与函数相同,只不过在信封内容的后面加上了
Response
,如清单 2 所示。
清单 2. SOAP 请求的响应
|
通常不需要自己编写 SOAP 消息,SOAP 库会自动生成。不过 SOAP 信封的结构和简单性表明使用 SOAP 标准共享信息很简单。
SOAP 大大简化了交换消息和调用远程函数的工作。远程过程调用(Remote Procedure Call,RPC)标准需要复杂的方法来处理二进制数据的序列化,发送结构化更高的信息需要详细的声明和双向的信息转换。
使用 SOAP,XML 序列化大大降低了这种复杂性,使得跨平台、跨语言集成和数据交换更加简单。
|
|
Web 服务描述语言(Web Services Description Language,WSDL)提供了一种描述 Web 服务(大多使用 SOAP)的简单方法。WSDL 允许您描述利用 SOAP 标准所提供的服务和接口。
比 方说,可以创建描述某台服务器上提供的服务的 WSDL 文件,然后把该文件分发给需要这些服务的 Web 服务消费者。通过阅读和解析 WSDL 文件,消费者能够了解到使用这些 Web 服务需要知道的所有信息,包括可以交换的数据类型、参数以及返回的各种错误和其他信息。
再次使用来自 W3C 的例子,可以看到不同远程函数的声明和交换的数据都是通过结构的 XML 定义处理的,如清单 3 所示。
清单 3. 不同远程函数和交换数据的 XML 定义
|
WSDL 声明了消息类型、默认数据类型和内容以及交换的数据结构。
访问服务器上 SOAP 结构需要使用的一切信息都可以在这个 WSDL 中找到。大多数语言和环境都提供一种阅读和解析 WSDL 的机制,以确定可用的函数和数据交换。
WSDL 不仅定义了用于交换信息的 SOAP 接口,通过适当的 WSDL 生成程序,还可用于创建发送请求、生成并格式化响应所需要的代码。
WSDL 和 SOAP 组成了一个强大的远程过程调用系统。
|
|
语 义 Web(Semantic Web)和语义网格(Semantic Grid)技术都依赖于资源描述框架(Resource Description Framework,RDF)这种灵活的描述语言。RDF 格式实际上是一个标准家族的成员之一。它用于描述信息和资源,使得系统很容易连接和关联不同的资源。
RDF 是另一种经过 W3C 批准的标准,它用于定义信息和资源。RDF 不需要 XML,但一种用于描述信息的序列化格式采用了 XML。
定义资源需要指定一个包含主语、谓词和宾语的表达式。比方说,如果描述一个网站的内容,主语就是该网站,谓词是 “包含信息”,宾语就是内容的类型。建立该网站和其他资源的联系,可使用 Friend of a Friend (FOAF) 标记建立两个资源之间的链接。
RDF 的目的是将关于资源和信息的自然语言的陈述转化为机器可解析的格式。比如可将
The MCSLP.com Website is authored by Martin C Brown
这句话改写为清单 4 所示的 RDF XML。
清单 4. RDF XML 格式的陈述
|
采用 RDF 标准的另一个例子是新闻站点和博客早期提供的连锁系统,它们使用 RDF 规范定义提要内容和不同的新闻。清单 5 提供了一个例子。
清单 5. 利用 RDF 规范定义提要内容和不同的新闻
|
RDF 标准最初设计的目的是描述 Web 上的资源、内容和关系。但是 RDF 现在变成了用于描述一般信息、资源和关系的标准。
语义 Web 和网格技术都需要定义资源及其之间的关系,使应用程序能够使用不同的信息,并且可以把数据捆绑在一起。
|
|
记录联系方式对所有商务应用程序都非常重要,通过有效的 XML 结构来捕获这些信息可以简化此类数据的处理。
联系信息变化可能很大,因此应该选择 XML 。比如,有些公司和个人可能有多个地址、电话号码和电子邮件帐户。在 XML 结构中很容易声明多个此类信息片段。
vCard 结构经常在 Internet 上用于表示联系信息,它独立于平台,很容易生成和导入不同的应用程序。它支持 XML 结构的某些灵活性,但实际上是一种基于文本的简单格式,使用声明性字段和扩展来提供信息。不同于 XML,vCard 格式是扁平文本,就是说不能直接向各种元素增加信息。电话号码是一个很好的例子,它不一定和某个地址关联,而仅仅作为记录中的另一个电话号码。
W3 联盟提出一种 vCard 格式的 XML,它采用 RDF XML 标准,以便于格式化和交换联系信息。采用 RDF 框架可以在声明过程中保留一些结构化信息。比如,RDF 标准支持使用包、序列和替代来描述数据。包支持多次声明一个对象(比如多种角色),并且可以在序列不重要时使用包。序列用于定义对象的次序,比如机构中人 员角色的层次结构。替代允许从列表中选择一项,比如多个电子邮件地址。
清单 6 显示了虚拟人物 Charles Perston 的 vCard。
清单 6. Charles Perston 的 vCard
|
采用 vCard XML 标准,可用清单 7 中的结构表示同样的信息。
清单 7. 使用 vCard XML 标准表示 Charles Perston
|
XML 格式更长,但容易理解所看的内容以及各部分之间的关系。这种格式可以了解更详细的信息和细节。比方说,很容易在地址中找到需要的国家,在标准 vCard 输出中该信息是比较隐含的。
再比如,很容易使用 XPath 或者 SAX 事件提取国家的列表,以便了解位于不同地区的联系人的数目。
|
|
能够编写文档,然后以多种不同的输出格式创建它,这曾是许多开发团队多年来的梦想。通过 DocBook XML 就可以实现,它不仅保持了语义标记,也保持了对资料格式化与输出的控制。
控制语义可以指定组成文档的章节和段落。在段落中可进一步详细规定包含的项。比方说可以将命令和函数名放在单独的标签中,如清单 8 所示。
清单 8. 使用单独的标签包装命令和函数
|
显示不同的元素时可以选择不同的输出样式和格式,也可选择相同的样式。更重要的是,因为语义信息回会被返回(比如文档可能包含对类名的引用),所以可以在编写索引时用它生成一个列表(该列表包含文档中详细描述的所有类名)。
除了语义标记外,文档的章节和不同部分还可以用特殊的 ID 标记,用这些 ID 建立文档不同部分的链接。有些类型可自动完成(章节、部分以及其他生成目录的类型),其他则需要明确建立到其他部分的链接。
转化成目标格式的时这些链接可以自动转换成适当的格式。比如,这个链接会转换为适当的 HTML 页面或页面中锚的链接。如果要生成 PDF,则可以包含目标章节的页码。
这种转换由 XSLT 样式表完成。现有的标准 DocBook XSLT 样式表支持到标准 HTML、XHTML、PDF(通过 FO 标准)、Texinfo、Java™ Help 和 Man 页面的转换。使用标准样式表还可以将数据转化成各种不同的大小和风格,书籍、A4 页面和幻灯片。
各种输出格式和标记的灵活性意味着:当创建文档时,可以使用相同的文档源代码提供打印的手册、内嵌式的帮助、man 页面、在线和上下文感知的信息。使用更传统的模型,可以分别编写这些元素。
DocBook XML 在技术文章社区得到了广泛的认可,很多公司所有的文档全部采用 DocBook XML 标准(或它的一个子集)。
|
|
FIX 是众多企业间数据交换格式之一,用于在商业活动中交换信息。此类交换信息通常很重要,比如交易支付数据、股票价格和商业信息的交换。
这些需要传输的信息有时候是非常小的包,有时候又是大段的数据。此类信息交换的传统格式是键/值对,这种形式的信息交换效率非常低。使用 XML 可以简化传递的数据结构,尤其是复杂的数据。
在基于 XML 的优化版本中,开发人员设法压缩了数据文件的大小,同时使数据更易于阅读。股票数据被压缩到了旧格式的四分之一大小。
除了典型的商业应用外,FIXML 不适合用于其他领域。但如果使用 FIXML 可以提高商业效率,结果是每个人都会受益。
|
|
可缩放向量图形(SVG)是一种描述绘图的 XML 标准。使用 SVG 可以描述线条、形状、位置及其之间的关系。最有吸引力的是这些信息可以输出为需要的格式,包括可缩放的图形和固定的图片。
SVG 解决了传统绘图过程中的一些重要问题。一般是使用专门的绘图程序完成的。在不同程序之间共享信息和绘图一般来说非常困难。保存为 SVG 意味着任何支持 SVG 的应用程序都能读取和处理这些文件。
绘图的另一个问题是,将它输出为最常用的(尤其是 Web 上)格式时,必须在显示或者结合到其他文档前翻译为位图格式(比如 JPEG 或 PNG)。这种传统的方法存在一些问题。首先,原始绘图必须明确(通常是手工)导出为位图格式。
其 次,由于位图格式以原始绘图的逐像素表示为基础,为保证图像的质量必须小心选择和输出目标匹配的尺寸和分辨率。比如,屏幕显示的分辨率需要 72dpi(或 96dpi)以便和多数监视器的标准分辨率匹配。打印输出则需要 300 到 2400 DPI。因此和原始文件相比生成的图像文件可能非常大。
虽然在 PostScript 和 Encapsulated PostScript 之前已经存在基于向量的格式,但是对 CPU 的要求非常高,不适合屏幕显示。
和其他任何向量图像格式一样,SVG 也采用各种形状的列表来描述图像内容,而不是生成像素表示。比如矩形只需要给出左上角作为起点,再加上两条边的长度就行了。图像的描述用 XML 表示。标签包括直线、矩形、多边形、圆等等,可以控制这些元素的样式和格式。
清单 9 给出了一个例子。这里绘制了一个矩形、一个透明的圆和一个三角形。
清单 9. 简单的图形
|
图 1 显示了生成图像的位图。
图 1. 图像的位图版本
SVG 格式描述图像的文件只有 500 多字节,PNG 接近 9 KB。
SVG 使绘图变得更小、更容易使用以及更容易兼容不同的应用程序。
|
|
Dublin Core 标准是一种信息分类方法,常用于图书馆。Dublin Core 标准有一个 XML Schema 定义了如何使用 XML 描述这类信息。Dublin Core 可以有效地对各种信息编目,并且使它们易于修改、查询和使用。
Dublin Core 目前在信息描述和定义中的应用使语义 Web 得以现实。通过使用一种统一的标准来描述数据,同时,更重要的是使用精心设计并经过实践检验的解决方案,可以详细描述其他 XML 文档中的数据,从而可以在不同来源之间有效地交换和比较信息。
Dublin Core 规范有自己的模式,但其目的是嵌入更大的 XML 文档,使用 XML 名称空间定义描述文档中其他数据所需要的 DC 元素。作为一个例子,阅读清单 10 看看如何在 RDF XML 模式中使用 DC 分类系统描述 RDF 实体的内容,比如网站。为此,可以扩展前面的 RDF 模式 示例中的结构。
清单 10. 在 RDF XML 模式中使用 DC 分类系统描述 RDF 实体的内容
|
清单 10 中使用 DC 元素添加描述、主题、发布者、版权和标识符信息以便对 RSS 提要分类。
完整的 Dublin Core Metadata Elements Set 包括 15 个元数据元素。
- Title
- Creator
- Subject
- Description
- Publisher
- Contributor
- Date
- Type
- Format
- Identifier
- Source
- Language
- Relation
- Coverage
- Rights
这为描述信息提供了一个广阔的范围。
|
|
XForms XML 标准用于定义表单中的不同成分(字段、单选按钮和列表等输入控件)以及希望在表单中提供的信息验证。
XForms XML 标准和 Web 开发人员熟悉的 HTML、XHTML 表单标记非常相似,并将成为 XHTML 2.0 标准的一部分。
XForms XML 基于简单的模型、视图、控制器格式。模型是表单的整体描述,包括字段、输入约束以及数据提交方式。视图定义了出现在表单中的控件、分组及其引用的模型字段。表单控件的格式和呈现由 CSS 控制。
XForms 标准通过更详细地划分表单信息扩展了传统的 HTML 表单定义。填充表单的过程中可使用动态元素(目前一般只能通过 JavaScript 或 Ajax 元素实现)。
清单 11 中可以看到一个简单的文本输入框和弹出式的选择框。
清单 11. 简单的文本输入框和弹出选择框
|
可以通过 Firefox XForms 扩展来查看该 XForms 表单。结果如图 2 所示。
图 2. 使用 Firefox XForms 扩展查看 XForms 表单
|
|
很多商业活动中的一个老问题是从纸质的客户发票系统迁移到计算机处理。创建发票结构需要认真考虑各种不同的类型和重复元素。
过去,发票这类商业信息的交换必须建立非常庞大的结构和定义,国际发票信息交换标准包括数百个字段。如果没有交换数据的有效方法,共享发票、订单和其他数据会非常困难。
由于没有统一的标准,很多组织开发出了核心发票标准的各种版本。其中,OASIS 组开发的标准可能是最知名的,也是大量公司和组织认可的一种。
这种结构是 OASIS 开发的 更庞大的框架 Universal Business Logic(UBL)的一部分,包括多种模式和工作流,从订单、打印发票到支付。这个系统非常复杂,不可能在本文中讨论,不过如果需要一种灵活、互操作的系统,UBL 是不错的起点。
|
|
本 文考察多种不同的 XML 模式,从简单的描述框架(RDF)到图形格式(SVG)再到商业工作流的完整结构(UBL)。无论哪一种,XML 结构和内容的灵活性都大大简化了这些系统的开发。此外,如果需要在不同的平台和环境之间共享数据,XML 的跨平台兼容性使得它成为一种理想的选择。对 WSDL 和 SOAP 而言,这是最重要的特性之一。
学习
-
您可以参考本文在 developerWorks 全球站点上的
英文原文
。
-
XML.org
:该网站提供了各种 XML 模式和标准的信息,包括 SOAP、WSDL 和 SVG。
-
The OASIS Universal Business Logic (UBL)
:了解使用 XML 的完整订单处理系统和工作流。
-
XForms 标准
:了解这种由 W3C 定义的 XML 标准。
-
Dublin Core Metadata Initiative (DCMI)
:访问这个组织的主页,它负责开发和说明用于在 XML 文档中描述信息的 Dublin Core 系统。
-
Scalable Vector Graphics (SVG)
:了解以向量格式描述图像这种 XML 标准。
-
vCard XML
:支持互操作的以 XML 描述联系人信息的标准。
-
XML 入门
(Doug Tidwell,developerWorks,2002 年 11 月):通过这篇经典的教程了解 XML 基础知识。
-
Using WSDL in SOAP applications
(Uche Ogbuji,developerWorks,2000 年 11 月):针对 WSDL 和 SOAP 程序员的入门资料。
-
Introduction to Scalable Vector Graphics
(Nicholas Chase,developerWorks,2004 年 3月):了解建立 SVG 文档需要的基本概念,比如基本形状、路径、文本、绘制模型以及动画和脚本。
-
理解 XForms
(Kurt Cagle,developerWorks,2007 年 7 月):了解 XForms 的基础。
-
An introduction to RDF
(Uche Ogbuji,developerWorks,2000 年 12 月):了解 RDF 的历史、模式和应用场景等。
-
SVG 和 XForms:基础知识
(Antoine Quint,developerWorks,2003 年 11 月):了解这两种可能联合在一起的技术。
-
IBM XML 认证
:了解如何才能成为一名 IBM 认证的 XML 及相关技术的开发专家。
-
XML 技术库
:developerWorks XML 专区提供了大量技术文章和技巧、教程、标准以及 IBM 红皮书。
-
developerWorks 技术活动和网络广播
:随时关注解技术动态。
-
技术书店
:浏览关于这个主题和其他技术主题的图书。
- developerWorks podcasts :收听针对软件开发人员的有趣访谈和讨论。
获得产品和技术
-
IBM 产品评估试用软件
:使用可直接从 developerWorks 下载的 IBM 试用软件构建您的下一个项目,包括来自 DB2®、Lotus®、Rational®、Tivoli® 和 WebSphere® 的应用程序开发工具和中间件产品。
讨论
-
XML 专区讨论论坛
:参加关于 XML 的讨论。
-
developerWorks XML 专区:分享您的观点:
阅读本文后,请把您的建议和观点发表到这个论坛上。XML 专区的编辑主持这个论坛,欢迎您的参与。
-
developerWorks blog
:看看这些 blog,并加入
developerWorks 社区
。
Martin Brown 作为一名专业作家有八年多了。他撰写了不少书和文章,内容涉及很多主题。他的特长涉猎很多开发语言和平台,包括:Perl、Python、Java、 JavaScript、Basic、Pascal、Modula-2、C、C++、Rebol、Gawk、Shellscript、Windows、 Solaris、Linux、BeOS、Mac OS/X、Web 编程以及系统管理和集成等。Martin 是 ServerWatch.com、LinuxToday.com 和 IBM developerWorks 专栏作家,定期在 Computerworld、The Apple Blog 和其他站点上发表博客文章,同时也是微软的 Subject Matter Expert(SME)。 |