處理字符串中標籤

用java清除字符串裏的樣式標籤

public class StringTest {
	public static void main(String[] args) {
		String b = "<p>的法國民法典</p><p>地方官號地方</p><p>的覆蓋面積地方官</p><p>地方能夠儘快那地方</p><p>的鳳飛飛,你,鬼地方。</p><p>的風格比較地方,地方和高科技的</p><p>當地放過。<br/></p>";
		String all = b.replaceAll("</?[a-zA-Z]+[^><]*>", "");
		System.out.println(all);
	}
}

 

如果要保留IMG標籤的話,正則表達式就是:</?[^/?(img)][^><]*>

如果想保留更多的標籤,只在正則表達式改一下就可以了, </?[^/?(img)|(p)][^><]*> 這個保留(這裏寫的保留了img,p這兩個標籤)你指定的標籤,其他的(包括font)全去掉, 如果你還有其他的標籤想保留,直接在裏面加一個 |(xxx)就行了

想去掉所有的標籤的話正則表達式爲:</?[a-zA-Z]+[^><]*>

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章