正則表達式的威力--輕鬆消除HTML代碼

      正則表達式再次讓我震撼,寥寥數行代碼就可以完成普通代碼不易實現的功能,至少是實現起來比較複雜的功能。

一、清楚內容中的Javsscript 代碼

 1 Function ClearJSCode(originCode)
 2 
 3   Dim reg
 4 
 5   set reg = New RegExp
 6 
 7   reg.Pattern = "<SCRIPT[^<]*</SCRIPT>"
 8   reg.IgnoreCase = True
 9   reg.Global = True
10 
11   clearJSCode = reg.Replace(originCode, "")
12 
13 End Function
14 

 二、清除內容中的HTML代碼

 1 Function ClearHTMLCode(originCode)
 2 
 3     Dim reg 
 4     set reg = new RegExp 
 5 
 6     reg.Pattern = "<[^>]*>"
 7     reg.IgnoreCase = True
 8     reg.Global = True
 9  
10     ClearHTMLCode = reg.Replace(originCode, "")
11 
12 End Function
13 



現在好多網站的內容都是使用採集程序生成的,使用上邊的代碼就可以輕鬆的將內容中的HTML和JS代碼清除掉。我來自:向東博客

發佈了74 篇原創文章 · 獲贊 6 · 訪問量 42萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章