DEDE萬能過濾規則

掌握了這個,好了上面四種應用基本上涵蓋了採集的各種應用。過濾基本上就不用求人了

採集的時候直接選擇幾個選項就可以了簡單的完成想過濾的東西。不過他只侷限於對文章內容的過濾不是很好。而 DEDE 卻能對所有采集的字段進行過濾,dede 採集過程中最麻煩的莫過於採集的正則過濾函數的編寫。說實在 dede 這點上和很多 ASP CMS 系統比如說動易等。功能上彌補了易用性的缺陷,期待柏拉圖在後續版本中加上選擇性過濾功能。

下面是綜合論壇上網友的各種正則的一個全集:

{dede:trim}

{/dede:trim}

{dede:trim}<param [^>]* >{/dede:trim}

{dede:trim}<emb [^>]* > [^>]* </embed>{/dede:trim}

{dede:trim}<emb [^>]* >{/dede:trim}

{dede:trim}</embed>{/dede:trim}

{dede:trim}<object [^>]* > [^>]* </object>{/dede:trim}

{dede:trim}<object [^>]* >{/dede:trim}

{dede:trim}</object>{/dede:trim}

{dede:trim}<OBJECT [^>]* > [^>]* </OBJECT>{/dede:trim}

{dede:trim}<OBJECT [^>]* >{/dede:trim}

{dede:trim}</OBJECT>{/dede:trim}

{dede:trim}<ifram [^>]* > [^>]* </iframe>{/dede:trim}

{dede:trim}<ifram [^>]* >{/dede:trim}

{dede:trim}</iframe>{/dede:trim}

{dede:trim}<IFRAME [^>]* > [^>]* </IFRAME>{/dede:trim}

{dede:trim}<IFRAME [^>]* >{/dede:trim}

{dede:trim}</IFRAME>{/dede:trim}

{dede:trim}<font [^>]* > [^<]* </font>{/dede:trim}

{dede:trim}<font [^>]* >{/dede:trim}

{dede:trim}</font>{/dede:trim}

{dede:trim}<a [^>]* > [^<]* </a>{/dede:trim}

{dede:trim}<a [^>]* >{/dede:trim}

{dede:trim}</a>{/dede:trim}

{dede:trim}<td [^>]* > [^>]* </td>{/dede:trim}

{dede:trim}<td [^>]* >{/dede:trim}

{dede:trim}</td>{/dede:trim}

{dede:trim}<tr [^>]* > [^>]* </tr>{/dede:trim}

{dede:trim}<tr [^>]* >{/dede:trim}

{dede:trim}</tr>{/dede:trim}

{dede:trim}<tbodi [^>]* > [^>]* </tbody>{/dede:trim}

{dede:trim}<tbody>{/dede:trim}

{dede:trim}</tbody>{/dede:trim}

{dede:trim}<tabl [^>]* > [^>]* </table>{/dede:trim}

{dede:trim}<t [^>]* >{/dede:trim}

{dede:trim}</table>{/dede:trim}

{dede:trim}<img [^>]* >{/dede:trim}

{dede:trim}<span [^>]* >{/dede:trim}

{dede:trim}</span>{/dede:trim}

{dede:trim} {/dede:trim}

{dede:trim}<stong>{/dede:trim}

{dede:trim}</stong>{/dede:trim}

應用示例一:標題中空格的過濾

標題文字裏面有空格,經常在採集文章的時候。採回來後應用很是麻煩,所以需要在過濾處添加下面正則過濾

{dede:trim} {/dede:trim}

應用示例二:來源作者中連接的過濾

有的系統裏面作者或者來源處都有連接,採集文章的時候。直接採集的話將連接採集回來瞭然後由於這兩個字段有限制,通常會造成需要採集的內容沒有采集回來,所以需要在過濾處添加下面正則過濾

{dede:trim}<a [^>]* > [^<]* </a>{/dede:trim}

應用示例三:文章內容中連接以及其他廣告代碼的過濾

直接用上面所有的代碼過濾就可以,這個就不用說了當需要對所有東西過濾的時候。但是實際應用中,只需要對連接、動畫、調用等進行過濾。這個需要依照對方內容裏面具體含有什麼代碼來具體操作)

使用二中的代碼進行過濾就可以了但是實際上一般的網站現在都在內容裏面加有廣告等,一般的只有鏈接。所以採取下面的過濾正則就可以完成過濾:

{dede:trim}<a [^>]* > [^<]* </a>{/dede:trim}

{dede:trim}<IFRAME [^>]* > [^>]* </IFRAME>{/dede:trim}

{dede:trim}<object [^>]* > [^>]* </object>{/dede:trim}

{dede:trim}<script [^>]* > [^>]* </script>{/dede:trim}

應用示例四:過濾 GG 廣告代碼

但是很多論壇裏的網友經常問這個,其實這個就是上面的內容過濾。所以單獨作爲一個應用列出來:

{dede:trim}<script [^>]* > [^>]* </script>{/dede:trim}

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章