有时候通过接口获取的到xml格式的字符串中存在特殊字符,如&,<等,没有进行转义。在使用dom4j进行转换时发生异常,异常信息如下。
1.Exception in thread "main" org.dom4j.DocumentException: Error on line 1 of document : 在实体引用中, 实体名称必须紧跟在 '&' 后面
2. Error on line 1 of document : 对实体 "信息" 的引用必须以 ';' 分隔符结尾。 Nested exception: 对实体 "信息" 的引用必须以 ';' 分隔符结尾
解决方法:
正则匹配指定元素的字符串,提取并进行替换。使用<![CDATA[具体内容]]>
例子:
字符串替换后,使用dom4j转换就正常了。