php使用正則表達式去掉html中的註釋


        最近在項目中在需要輸出瀏覽器中的源文件需要去掉html中的註釋,在網上看了很多的方案,不過很多的答案都是一樣的,並不能解決我的問題,於是就自己寫正則表達式,也對正則有了更加深刻的理解。

         首先比較基礎的是:

$a = '<!--ceshi-->ceshi';
$a = preg_replace('#<!--.*-->#' , '' , $a);
var_dump($a);

       上面的代碼會輸出ceshi。

       但是如果是下面的字符串的話,就不能達到我們希望的效果了

$a = '<!--ceshi-->ceshi<!--ceshi-->';
$a = preg_replace('#<!--.*-->#' , '' , $a);
var_dump($a);

     於是我們就把匹配規則改成如下的格式


preg_replace('#<!--.*?-->#' , '' , $a);
      但是在html中如果有<!--[if lt IE 9]>ceshi<![endif]-->這樣的代碼的話是不能去掉的,所以我們需要改進匹配規則,改成以下的格式

preg_replace('#<!--[^\!\[]*?-->#' , '' , $a);

      又接着如果html中有<script><!--ceshi//--></script>的代碼,我們又需要改一下我們的匹配規則了,改成了以下格式

preg_replace('#<!--[^\!\[]*?(?<!\/\/)-->#' , '' , $a);

     這樣的話我基本上就去掉了我需要去掉的html的註釋了!

     2016/09/01記錄



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章