Linux命令中使用正則表達式

在使用grep、awk和sed命令時,需要使用正則表達式。
比如我通過grep找代碼編譯結果中是否有錯誤。或者是否有我代碼的錯誤。
這裏說下正則表達式基本的應用:


匹配行首與行尾。
匹配數據集。
只匹配字母和數字。
匹配一定範圍內的字符串集。

 

^只匹配行首
$只匹配行尾
*一個單字符後緊跟*,匹配0個或多個此單字符
[]匹配[]內字符,可以是一個單字符,也可以是字符序列。可以使用 - 表示[]內字符序列範圍,如用[1-5]代替[12345]
\用來屏蔽一個元字符的特殊含義。因爲有時在shell中一些元字符有特殊含義。\可以使其失去應有含義。
.匹配任意單字符
pattern\{n\}用來匹配前面pattern出現次數。n爲次數
pattern\{n,\}含義同上,但次數最少爲n
patter\{n,m\}含義同上,但pattern出現次數在n與m之間

 

  1. 使用句點匹配單字符
    句點“.”可以匹配任意單字符。例如,如果要匹配一個字符串,以be g開頭,中間夾一個
    任意字符,那麼可以表示爲be g . n,“.”可以匹配字符串頭,也可以是中間任意字符。
    在ls-l命令中,可以匹配一定權限:
    .. . x . . x . . x
    此格式匹配用戶本身,用戶組及其他組成員的執行權限。
    ~$ ls -l |grep ...x..x..x
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp
    ~$

  2. 在行首以^匹配字符串或字符序列
    ^只允許在一行的開始匹配字符或單詞。例如,使用ls-l命令,並匹配目錄。之所以可以
    這樣做是因爲ls-l命令結果每行第一個字符是d,即代表一個目錄。
    ~$ ls -l |grep ^d
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp

  3. 在行尾以$匹配字符串或字符
    可以說$與^正相反,它在行尾匹配字符串或字符,$符號放在匹配單詞後。假定要匹配以
    單詞lisp結尾的所有行,操作爲:
    ~$ ls |grep sp$
    lisp
    site-lisp
    ~$

  4. 使用*匹配字符串中的單字符或其重複序列
    使用此特殊字符匹配任意字符或字符串的重複多次表達式。例如:
    找e*m(以e開頭m結束的字符串)
    ~$ ls | grep e*m
    emacs
    leim
    ~$

  5. 使用\屏蔽一個特殊字符的含義
    有時需要查找一些字符或字符串,而它們包含了系統指定爲特殊字符的一個字符。什麼
    是特殊字符?
    一般意義上講,下列字符可以認爲是特殊字符:
    $ . ' " * [ ] ^ | { } \ + ?
    例如:找以.el後綴的文件
    ~/lisp$ ls | grep \.el$
    abbrev.el
    abbrevlist.el
    add-log.el
    align.el
    allout.el
    ansi-color.el
    apropos.el
    arc-mode.el
    array.el
    autoarg.el
    autoinsert.el
    autorevert.el
    avoid.el
    battery.el
    bindings.el
    bookmark.el
    bs.el
    buff-menu.el
    button.el
    calculator.el
    case-table.el

  6. 使用[]匹配一個範圍或集合
    使用[]匹配特定字符串或字符串集,可以用逗號將括弧內要匹配的不同字符串分開,但並
    不強制要求這樣做(一些系統提倡在複雜的表達式中使用逗號),這樣做可以增加模式的可讀
    性。
    使用“-”表示一個字符串範圍,表明字符串範圍從“-”左邊字符開始,到“-”右邊字
    符結束。
    如果熟知一個字符串匹配操作,應經常使用[]模式。
    假定要匹配任意一個數字,可以使用:
    [0123456789]
    然而,通過使用“-”符號可以簡化操作:
    [0-9]
    或任意小寫字母
    [a-z]
    要匹配任意字母,則使用:
    [A-Za-z]
    表明從A-Z、a-z的字母範圍。
    如要匹配任意字母或數字,模式如下:
    [A-Za-z0-9]
    注意^符號的使用,當直接用在第一個括號裏,意指否定或不匹配括號裏內容。
    [^a-zA-Z]
    匹配任一非字母型字符,而
    [^0-9]
    匹配任一非數字型字符。
    通過最後一個例子,應可猜知除了使用^,還有一些方法用來搜索任意一個特殊字符。

  7. 使用\{\}匹配模式結果出現的次數
    使用*可匹配所有匹配結果任意次,但如果只要指定次數,就應使用\{ \ },此模式有三種
    形式,即:
    pattern\{n\}匹配模式出現n次。
    pattern\{n,\}匹配模式出現最少n次。
    pattern\{n,m}匹配模式出現n到m次之間,n , m爲0 - 2 5 5中任意整數。

    例如格式如下:前4個字符是數字,接下來是xx,最後4個也是數字,
    操作如下:
    [0-9]\{4\}XX[0-9]\{4\}
    具體含義如下:
    1)匹配數字出現4次。
    2)後跟代碼xx。
    3)最後是數字出現4次。


經常使用的正則表達式舉例

^                                 行首

$                                 行尾

^ [ t h e ]                      以t h e開頭行

[ S s ] i g n a [ l L ]              匹配單詞s i g n a l、s i g n a L、S i g n a l、S i g n a L

[Ss]igna[lL]".                同上,但加一句點

[ m a y M A Y ]             包含m a y大寫或小寫字母的行

^ U S E R $                  只包含U S E R的行

[tty]$                           以t t y結尾的行

" .                                帶句點的行

^ d . . x . . x . . x          對用戶、用戶組及其他用戶組成員有可執行權限的目錄

^ [ ^ l ]                        排除關聯目錄的目錄列表

^[^d]                ls –l | grep ^[^d] 只顯示非文件夾的文件         

[ . * 0 ]                       0之前或之後加任意字符

[ 0 0 0 * ]                  0 0 0或更多個

[ iI]                             大寫或小寫I

[ i I ] [ n N ]                大寫或小寫i或n

[ ^ $ ]                         空行

[ ^ . * $ ]                     匹配行中任意字符串

^ . . . . . . $                  包括6個字符的行

[a- zA-Z]                     任意單字符

[ a - z ] [ a - z ] *         至少一個小寫字母

[ ^ 0 - 9 " $ ]                非數字或美元標識

[ ^ 0 - 0 A - Z a - z ]     非數字或字母

[ 1 2 3 ]                       1到3中一個數字

[ D d ] e v i c e            單詞d e v i c e或D e v i c e

D e . . c e                    前兩個字母爲D e,後跟兩個任意字符,最後爲c e

" ^ q                            以^ q開始行

^ . $                            僅有一個字符的行

^".[0-9][0-9]                以一個句點和兩個數字開始的行

' " D e v i c e " '            單詞d e v i c e

D e [ V v ] i c e " .               單詞D e v i c e或d e v i c e

[ 0 - 9 ] " { 2 " } - [ 0 - 9 ] " { 2 " } - [ 0 - 9 ] " { 4 " }      對日期格式d d - m m - y y y y

[ 0 - 9 ] " { 3 " } " . [ 0 - 9 ] " { 3 " } " . [ 0 - 9 ] " { 3 " } " . [ 0 - 9 ] " { 3 " } I P地址格式

[ ^ . * $ ]                     匹配任意行

[A-Za-z]*            匹配所有單詞

 

 

 

常用的g r e p選項

-c 只輸出匹配行的計數。

-i 不區分大小寫(只適用於單字符)。

-h 查詢多文件時不顯示文件名。

-l 查詢多文件時只輸出包含匹配字符的文件名。

-n 顯示匹配行及行號。

-s 不顯示不存在或無匹配文本的錯誤信息。

-v 顯示不包含匹配文本的所有行。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章