Vim中的正則表達式功能很強大,如果能自由運用,則可以完成很多難以想象的操作。如果你比較熟悉Perl的正規表達式,可以直接參照與Perl正則表達式的區別一節。
一、使用正則表達式的命令
使用正則表達式的命令最常見的就是 / (搜索)命令。其格式如下:
/正則表達式
另一個很有用的命令就是 :s(替換)命令,將第一個//之間的正則表達式替換成第二個//之間的字符串。
:s/正則表達式/替換字符串/選項
二、元字符
元字符是具有特殊意義的字符。使用元字符可以表達任意字符、行首、行 尾、某幾個字符等意義。
元字符一覽
. 匹配任意一個字符
[abc] 匹配方括號中的任意一個字符。可以使用-表示字符範圍,
如[a-z0-9] 匹配小寫字母和阿拉伯數字。
[^abc] 在方括號內開頭使用^符號,表示匹配除方括號中字符之外的任意字符。
\d 匹配阿拉伯數字,等同於[0-9]。
\D 匹配阿拉伯數字之外的任意字符,等同於[^0-9]。
\x 匹配十六進制數字,等同於[0-9A-Fa-f]。
\X 匹配十六進制數字之外的任意字符,等同於[^0-9A-Fa-f]。
\w 匹配單詞字母,等同於[0-9A-Za-z_]。
\W 匹配單詞字母之外的任意字符,等同於[^0-9A-Za-z_]。
\t 匹配<TAB>字符。
\s 匹配空白字符,等同於[ \t]。
\S 匹配非空白字符,等同於[^ \t]。
另外,如果要查找字符 * 、. 、/等,則需要在前面用 \ 符號,表示這不是元字符,而只是普通字符而已。
\* 匹配 * 字符。
\. 匹配 . 字符。
\/ 匹配 / 字符。
\\ 匹配 \ 字符。
\[ 匹配 [ 字符。
表示數量的元字符
* 匹配0-任意個
\+ 匹配1-任意個
\? 匹配0-1個
\{n,m} 匹配n-m個
\{n} 匹配n個
\{n,} 匹配n-任意個
\{,m} 匹配0-m個
表示位置的符號
$ 匹配行尾
^ 匹配行首
\< 匹配單詞詞首
\> 匹配單詞詞尾
使用例
/char\s\+[A-Za-z_]\w*;
" 查找所有以char開頭,之後是一個以上的空白,最後是一個標識符和分號"
/\d\d:\d\d:\d\d
" 查找如 17:37:01 格式的時間字符串"
:g/^\s*$/d
" 刪除只有空白的行"
:s/\<four\>/4/g
" 將所有的four替換成4,但是fourteen中的four不替換"
三、替換變量
在正規表達式中使用 \ ( 和 \ ) 符號括起正規表達式,即可在後面使用\1、\2 等變量來訪問 \ ( 和 \ ) 中的內容。
使用
/\(a\+\)[^a]\+\1
#查找開頭和結尾處a的個數相同的字符串, 如 aabbbaa,aaacccaaa,但是不匹配 abbbaa
:s/\(http:\/\/[-a-z\._~\+%\/]\+\)/<a href="\1">\1<\/a>/
#將URL替換爲<a href="http://url">http://url</a>的格式
:s/\(\w\+\)\s\+\(\w\+\)/\2\t\1
#將 data1 data2 修改爲 data2 data1
#在替換命令 s/// 中可以使用函數表達式來書寫替換內容,格式爲:
:s/替換字符串/\=函數式
#在函數式中可以使用 submatch(1)、submatch(2) 等來引用 \1、\2 等的內容,而submatch(0)可以引用匹配的整個內容
使用例
:%s/\<id\>/\=line(".")
" 將各行的 id 字符串替換爲行號"
:%s/^\<\w\+\>/\=(line(".")-10) .".". submatch(1)
" 將每行開頭的單詞替換爲 (行號-10).單詞 的格式,如第11行的 word 替換成 1. word"
五、與Perl正則表達式的區別
元字符的區別
Vim語法 Perl語法 含義
\+ + "1-任意個"
\? ? "0-1個"
\{n,m} {n,m} "n-m個"
和
(和) "分組"
六、 正則表達式練習(vi)
閒言碎語不要講…例子說明一切,比如下面這段我需要換成 ubb 標籤
vim 命令模式,輸入:
:%s/.*src=”([^"]*)”[^>]*>/[img]1[/img]/g
解釋如下:
%s "表示查找並替換"
%s/a/b/g "a 被查找的字符串(正則匹配);b 要替換成的文字;g 表示全局搜索替換(否則只處理找到的第一個結果"
([^"]*) "表示非引號的字符N個;外面 () 表示後面替換要用(用 1,…,9等引用)"
/ 需要被 轉義
與其它工具正則不一樣的地方在於 () 也必須 (),怪不得我老是弄不出來。
相關資料:
via http://net.pku.edu.cn/~yhf/tao_regexps_zh.html
vi 命令 作用
:%s/ */ /g 把一個或者多個空格替換爲一個空格。
:%s/ *$// 去掉行尾的所有空格。
:%s/^/ / 在每一行頭上加入一個空格。
:%s/^[0-9][0-9]* // 去掉行首的所有數字字符。
:%s/b[aeio]g/bug/g 將所有的bag、beg、big和bog改爲bug。
:%s/t([aou])g/h1t/g 將所有tag、tog和tug分別改爲hat、hot和hug(注意用group的用法和使用1引用前面被匹配的字符)。
Sed
Sed是Stream EDitor的縮寫,是Unix下常用的基於文件和管道的編輯工具,可以在手冊中得到關於sed的詳細信息。
這裏是一些有趣的sed腳本,假定我們正在處理一個叫做price.txt的文件。注意這些編輯並不會改變源文件,sed只是處理源文件的每一行並 把結果顯示在標準輸出中(當然很容易使用重定向來定製):
sed腳本 描述
sed ’s/^$/d’ price.txt 刪除所有空行
sed ’s/^[ ]*$/d’ price.txt 刪除所有隻包含空格或者製表符的行
sed ’s/”//g’ price.txt 刪除所有引號
原文鏈接
http://www.cnblogs.com/PegasusWang/p/3153300.html
最後加一個自己應用的實例。在python中,有些代碼是2.x版本的,print不用加括號,如果換成3.x又得加上括號,手動添加很麻煩喲。那麼如何利用vim的正則表達式來實現查找替換呢。命令如下:
s/print\s*.∗$/print(\1)
s/print\s*\ (.*\ )$/print\1
由於版本原因,新版本的python print函數需要加上括號。
可以使用notepad使用以下正則批量替換:
print (.*?);?$
替換爲
print $1