Welcome 微信登录

首页 / 软件开发 / JAVA / Dom4j格式化转义字符问题

Dom4j格式化转义字符问题2011-10-22 leizhimin 1、不得不说的XML CDATA部件

在XML文档中的所有文本都会被解析器解析。

只有在CDATA部件之内的文本会被解析器忽略。

不合法的XML字符必须被替换为相应的实体。

如果在XML文档中使用类似"<" 的字符, 那么解析器将会出现错误,因为解析器会认为这是一个新 元素的开始。

&lt;<小于号
&gt;>大于号
&amp;&
&apos;"单引号
&quot;"双引号

实体必须以符号"&"开头,以符号";"结尾。
注意: 只有"<" 字符和"&"字符对于XML来说是严格禁止使用的。剩下的都是合法的,为了减少 出错,使用实体是一个好习惯。

CDATA部件
在CDATA内部的所有内容都会被解析器忽略。

如果文本包含了很多的"<"字符和"&"字符——就象程序代码一样,那么最好把他们都放到 CDATA部件中。

一个 CDATA 部件以"<![CDATA[" 标记开始,以"]]>"标记结束:

CDATA注意事项:
CDATA部件之间不能再包含CDATA部件(不能嵌套)。如果 CDATA部件包含了字符"]]>" 或者"<! [CDATA[" ,将很有可能出错哦。

同样要注意在字符串"]]>"之间没有空格或者换行符。

2、Dom4j格式化转义字符问题

person.xml

<?xml version="1.0" encoding="UTF-8"?>
<person>
<name>张三</name>
<addr><![CDATA[经三路<鑫苑>19F]]></addr>
</person>