Java中的XML: Java文档模型的用法

Java中的XML: Java文档模型的用法2011-01-25 IBM Dennis M. Sosnoski在本系列的第一篇文章中，我研究了一些用 Java 编写的主要的 XML 文档模型的性能。但是，在开始选择这种类型的技术时，性能只是问题的一部分。使用方便至少是同样重要的，并且它已是一个主要理由，来支持使用 Java 特定的模型，而不是与语言无关的 DOM 。

为切实了解哪个模型真正的作用，您需要知道它们在可用性程度上是如何排名的。本文中，我将尝试进行这个工作，从样本代码开始，来演示如何在每个模型中编码公共类型的操作。并对结果进行总结来结束本文，而且提出了促使一种表示比另一种更容易使用的一些其它因素。

请参阅以前的文章来获取这个对比中使用的各个模型的背景资料，包含实际的版本号。还可以参阅“参考资料”一节中关于源代码下载、到模型主页的链接以及其它相关信息。

代码对比

在对不同文档表示中用法技术的这些对比中，我将显示如何在每种模型中实现三种基本操作：

根据输入流构建文档

遍历元素和内容，并做一些更改：

从文本内容中除去前导和尾随的空白。

如果结果文本内容为空，就删除它。

否则，将它包装到父元素的名称空间中一个名为“text”的新元素中。

将已修改的文档写入输出流

这些示例的代码是以我在上篇文章中使用的基准程序为基础的，并进行了一些简化。基准程序的焦点是为了显示每个模型的最佳性能；对于本文，我将尝试显示在每种模型中实现操作的最简便方法。

我已经将每个模型的示例结构化为两个独立的代码段。第一段是读取文档、调用修改代码和编写已修改文档的代码。第二段是真正遍历文档表示和执行修改的递归方法。为避免分散注意力，我已在代码中忽略了异常处理。

即使您不想使用 DOM 实现，但还是值得浏览下面对 DOM 用法的描述。因为 DOM 示例是第一个示例，所以与后面的模型相比，我用它来探究有关该示例的一些问题和结构的更详细信息。浏览这些内容可以补充您想知道的一些细节，如果直接阅读其它模型之一，那么将错过这些细节。

DOM

DOM 规范涵盖了文档表示的所有类型的操作，但是它没有涉及例如对文档的语法分析和生成文本输出这样的问题。包括在性能测试中的两种 DOM 实现，Xerces 和 Crimson，对这些操作使用不同的技术。清单 1 显示了 Xerces 的顶级代码的一种形式。

清单 1. Xerces DOM 顶级代码

1 // parse the document from input stream （"in"）
2 DOMParser parser = new DOMParser（）;
3 parser.setFeature（"http://xml.org/sax/features/namespaces", true）;
4 parser.parse（new InputSource（in））;
5 Document doc = parser.getDocument（）;
6 // recursively walk and modify document
7 modifyElement（doc.getDocumentElement（））;
8 // write the document to output stream （"out"）
9 OutputFormat format = new OutputFormat（doc）;
10 XMLSerializer serializer = new XMLSerializer（out, format）;
11 serializer.serialize（doc.getDocumentElement（））;