editplus 裏面的正則表達式

Editplus 是windows平臺裏常用的多功能編輯器,一直不忍放棄。其實它也支持RE,只是功能有限。

參考博文 http://www.williamlong.info/archives/4448.html

總結如下:

1. 不支持 重複頻度 的定義,如:{3}、{3,}、{3,6}...

2. 支持的元字符比較少,列表如下:


     空格  直接鍵入,不支持\b

\t      製表符.

\n      新行.

  .      匹配任意字符.

  |      匹配表達式左邊和右邊的字符. 例如, "ab|bc" 匹配 "ab" 或者 "bc".

  []      匹配列表之中的任何單個字符. 例如, "[ab]" 匹配 "a" 或者 "b". "[0-9]" 匹配任意數字.

  [^]     匹配列表之外的任何單個字符.例如, "[^ab]" 匹配 "a" 和 "b" 以外的字符. "[^0-9]" 匹配任意非數字字符.

  *      其左邊的字符被匹配任意次(0次,或者多次). 例如 "be*" 匹配 "b", "be" 或者 "bee".

  +      其左邊的字符被匹配至少一次(1次,或者多次). 例如 "be+" 匹配 "be" 或者 "bee" 但是不匹配 "b".

  ?      其左邊的字符被匹配0次或者1次. 例如 "be?" 匹配 "b" 或者 "be" 但是不匹配 "bee".

  ^      其右邊的表達式被匹配在一行的開始.例如 "^A" 僅僅匹配以 "A" 開頭的行.

  $      其左邊的表達式被匹配在一行的結尾. 例如 "e$" 僅僅匹配以 "e" 結尾的行.

  ()      影響表達式匹配的順序,並且用作表達式的分組標記.

  \      轉義字符. 如果你要使用 "\" 本身, 則應該使用 "\\".

3. 幾個特殊實例:

     3.1 數字替換

  把          a1hij23bcd456ef7890xyz

  替換爲:  a[1]hij[23]bcd[456]ef[7890]xyz

方法: [0-9]+ → [\0\1\2], 其中\0\1\2是定位原字符

  3.2 刪除每一行行尾的指定字符 

  cat a.txt

  12345 1265345

  2345

  刪除每行末尾的“345”

   方法345$ → 空  如果是行首,則前面加“^”

     3.3 刪除空行 :   ^[ \t]*\n → 空 (推薦)  或  [\n]+ → \n

   note:\t前有空格符" "。我們把僅有空格符和製表符的行也當做空行。   

     3.4 替換帶有半角括號的多行

  幾百個網頁中都有下面一段代碼,我想把它們都去掉,可是找了很多search&replace的軟件,都是隻能對“一行”進行操作。
  EditPlus打開幾百個網頁文件還是比較順暢的,所以完全可以勝任這個工作。
  方法:在Editplus中使用正則表達式,由於“(”、“)”被用做預設表達式(或者可以稱作子表達式)的標誌,所以需要使用\轉義。

  3.5中間包含文字替換

  如果要替換中間包含某文字的一行,例如包含yahoo,則可使用如下表達式匹配一行內容
  ^.*yahoo.*
  中間不包含文字替換
  如果要替換中間不包含某文字的一行,例如不包含yahoo,則可使用如下表達式匹配一行內容
  ^(?!.*yahoo).*

3.6查找url並提取

  www.baidu.com">http://www.baidu.com
  方法:  ()→\1  或 (http://.*)→\1

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章