SAX解析xml的characters方法被多次调用

描述:

sax解析,也叫事件解析,就是在解析数据的时候,是逐个向前解析的。

比如<name>abcefg</name>元素,首先解析到<name>,接着解析数据内容,当把内容解析到abc时,可能内存就要清理一次,然后再次调用characters(char[] ch, int start, int length)解析efg内容后,才继续向下解析,当解析到</name>时说明是结束标记。

这个过程中,因为各种原因比如:解析内容有\n 和 \t ,或者内存清理,都会导致同一元素内,多次调用characters。

解决办法方法: 

建议, 每次characters时调用sb.append(ch, start, length); 先临时缓存起来,

在endElement的时候才调用String str = sb.toString() 。

	// 元素的开始标签
	@Override
	public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
		sb = new StringBuilder();
	}

	//  元素的内容
	@Override
	public void characters(char[] ch, int start, int length) throws SAXException {
		sb.append(new String(ch, start, length));
	}

	// 元素的结束标签
	@Override
	public void endElement(String uri, String localName, String qName) throws SAXException {
		 String s = sb.toString();
	}

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章