正則表達式再次讓我震撼,寥寥數行代碼就可以完成普通代碼不易實現的功能,至少是實現起來比較複雜的功能。
一、清楚內容中的Javsscript 代碼
2
3 Dim reg
4
5 set reg = New RegExp
6
7 reg.Pattern = "<SCRIPT[^<]*</SCRIPT>"
8 reg.IgnoreCase = True
9 reg.Global = True
10
11 clearJSCode = reg.Replace(originCode, "")
12
13 End Function
14
二、清除內容中的HTML代碼
2
3 Dim reg
4 set reg = new RegExp
5
6 reg.Pattern = "<[^>]*>"
7 reg.IgnoreCase = True
8 reg.Global = True
9
10 ClearHTMLCode = reg.Replace(originCode, "")
11
12 End Function
13
現在好多網站的內容都是使用採集程序生成的,使用上邊的代碼就可以輕鬆的將內容中的HTML和JS代碼清除掉。我來自:向東博客