Linux中使用正則表達式


正則表達式(regular expression):是一種指定字符串模式的簡潔方式。通常簡寫爲regex或re。最常見的應用就是搜索字符串。



通過一個例子來學習正則表達式。現在有如下的一個data.txt文件:

Harley is smart


Harley


I like Harley


the dog likes the cat


搜索以”Harley“開頭的行:grep ‘^Harley’ data 
搜索以”Harley“結尾的行:grep ‘Harley$’ data
搜索整行都是“Harley”的行:grep ‘^Harley$’ data
統計空行數:grep ‘^$’ data | wc -l
查找包含字符串“Har”的行,並且“Har”出現在單詞的開頭:grep '\<Har' data
查找包含字符串“Har”的行,並且“Har”出現在單詞的結尾:grep 'Har\>' data
查找包含字符串“Harley”的行,並且“Harley”爲單詞:grep '\<Harley\>' data
查找包含字符串”Har“後面跟兩個任意字符,再跟一個字母”y“的行:grep 'Har..y' data
查找包含字符串”Har“後面跟A或者a的字符串的行:grep 'H[aA]' data
使用預定義字符類查找包含包含大寫字母后跟小寫字母的所有行:grep '[[:upper:]][[:lower:]]' data
使用範圍查找包含字符串”3-9“字符串中任意一個的所有行:grep '[3-9]' d
查找包含字符串”X“,同時後面不跟有“a”和“o”的所有行:grep ‘X[^ao]’ data
使用範圍和預定義字符類查找一行中某一個字符是非字母字符的行:
grep ‘[^A-Za-z]’ data
grep '[^[:alpha:]]' data
理解正則表達式的關鍵就是記住每個字符類只表示一個單獨的字符。
查看區域設置:locate
查看所有可用區域設置:locate -a
查找包含大寫字母的“H”後面包含跟0個或者多個小寫字母的行:grep 'H[[:lower:]]*' data
/* *號表示匹配前面的字符0次或者多次出現*/
最常用的是.*可以匹配任何字符的0次或者多次出現。
/* +號表示匹配前面的字符1次或者多次出現, ?號表示匹配前面的字符1次或者0次出現*/
{n}正好匹配n次
{n,}至少匹配n次
{,m}最多匹配m次(在一些程序中無法使用)
{n,m}至少匹配n次,最多匹配m次
查找所有包含2個數字或者3個數字的行(使用\<.\>匹配整個數字):grep ‘\<[0-9]{2,3}\>’ data
查找cat dog bird hamster中包含上述任意單詞的一行:grep '\<(cat|dog|bird|hamster)\>' data
如果希望查找真是的*,.或者|,可以使用\引用這些字符。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章