处理字符串中标签

用java清除字符串里的样式标签

public class StringTest {
	public static void main(String[] args) {
		String b = "<p>的法国民法典</p><p>地方官号地方</p><p>的覆盖面积地方官</p><p>地方能够尽快那地方</p><p>的凤飞飞,你,鬼地方。</p><p>的风格比较地方,地方和高科技的</p><p>当地放过。<br/></p>";
		String all = b.replaceAll("</?[a-zA-Z]+[^><]*>", "");
		System.out.println(all);
	}
}

 

如果要保留IMG标签的话,正则表达式就是:</?[^/?(img)][^><]*>

如果想保留更多的标签,只在正则表达式改一下就可以了, </?[^/?(img)|(p)][^><]*> 这个保留(这里写的保留了img,p这两个标签)你指定的标签,其他的(包括font)全去掉, 如果你还有其他的标签想保留,直接在里面加一个 |(xxx)就行了

想去掉所有的标签的话正则表达式为:</?[a-zA-Z]+[^><]*>

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章