将XML结点转换成JAVABEAN并存入数据库

将XML结点转换成JAVABEAN并存入数据库2008-05-071.概述

我们要将外部系统给的XML文件进行解析，并存入到数据库。

但是我们并没有DTD或者Schema，只有一个WORD格式的说明文档；更离谱的是，XML结点树的结构（即XML结点与XML结点之间的关系）与业务Bean树的结构（即业务Bean与业务Bean的关系）并不完全一致，比如说，从业务角度讲，一只猪有只猪头，而在XML里，却写成了 pig --content --pighead 的三级关系，无端端多了一个content结点！没有DTD/Schema，结构又不规范，我们就没法用自动化的第三方JAVA转换API进行解析，而只能手动地、一个一个地解析。但在手动解析的过程中，我们仍然发现各个结点的解析和入库中有很多东西是共同的，或者有共同的规律，这些东西可以抽出来作为一个准框架，然后再将结点中不同的部分开放出来，允许具体的结点做具体的实现，并最终形成一个半自动的解析/入库框架。

为什么说它是半自动的？它有哪些限制？

自动：不必为每个结点编写XML 解析代码和入库代码

“半”：需手动地编写每个JAVABEAN，并手动地为每个BEAN建表

限制：

a.所有业务字段的类型只能设为STRING/VARCHAR，并且非业务字段的类型在BEAN中不能为STRING

b.BEAN名与表名必须相同，或者可以进行一对一映射

c.BEAN的成员变量名必须与XML结点的属性名/元素名相同，或者可以进行一对一映射

这三种限制都是利用JAVA反射机制进行自动操作的前提。

2.基本思想

所谓的XML解析，就是将XML结点转换成JAVABEAN实例，XML结点的ATTRIBUTE值和ELEMENT值就是JAVABEAN实例的成员变量值; 所谓的持久化，就是将JAVABEAN实例变成数据库对应表中的一条记录，JAVABEAN实例的成员变量值就是记录中某个字段的值，或者其他表中某个参考了该记录的另一条记录。

而在XML中，JAVABEAN体系中，数据据表关系结构中，结点和结点之间的关系都是树形的关系。整体的解析和入库，就是在遍历树时执行转换动作。而我们知道，树的遍历是可以用递归算法实现的，而递归，就不用说了吧，它是实现程序“自动化”的主要途径之一。

以下是对各“树”的具体分析：

假设两个业务实体A和B之间存在聚合关系（父子关系）。那么具体可分三种情况：

a.B是一个原子字段（即不可再分），并且是A的一个属性。

XML中，B是A的XML ATTRIBUTE或者A的原子ELEMENT

BEAN中，B是A的成员变量，并且B是一个JAVA内置的数据类型

数据库中，B是A表的一个列

b.B是一个复合字段，并且是A的一个属性，而且和A是1:1关系

XML中，B是A的ELEMENT，并且B有自己的ELEMENT或者ATTRIBUTE

BEAN中，B是A的成员变量，并且程序中有个B类

数据库中，B表是A表的子表（即B外键参考了A表）

c.B是一个复合字段，并且是A的一个属性，而且和A是N:1关系

XML中，B是A的ELEMENT，并且B有自己的ELEMENT或者ATTRIBUTE

BEAN中，B组成一个类集（List,Set）共同作为A的成员变量，并且程序中有个B类

数据库中，B表是A表的子表（即B外键参考了A表）

了解了这三种情况，接下来就好办了。程序每抓到一个结点，都要递归地进行以下处理：先处理它的原子属性（情形a），接着处理它的单个子结点（情形b），最后处理它的类集子结点（情形c）。