用java清除字符串裏的樣式標籤
public class StringTest {
public static void main(String[] args) {
String b = "<p>的法國民法典</p><p>地方官號地方</p><p>的覆蓋面積地方官</p><p>地方能夠儘快那地方</p><p>的鳳飛飛,你,鬼地方。</p><p>的風格比較地方,地方和高科技的</p><p>當地放過。<br/></p>";
String all = b.replaceAll("</?[a-zA-Z]+[^><]*>", "");
System.out.println(all);
}
}
如果要保留IMG標籤的話,正則表達式就是:</?[^/?(img)][^><]*>
如果想保留更多的標籤,只在正則表達式改一下就可以了, </?[^/?(img)|(p)][^><]*> 這個保留(這裏寫的保留了img,p這兩個標籤)你指定的標籤,其他的(包括font)全去掉, 如果你還有其他的標籤想保留,直接在裏面加一個 |(xxx)就行了
想去掉所有的標籤的話正則表達式爲:</?[a-zA-Z]+[^><]*>