第七章、grep及正則表達式

第七章、grep及正則表達式


04_04_grep及正則表達式 


grep家族: grep, egrep, fgrep  

 

grep: 根據模式搜索文本,並將符合模式的文本行顯示出來。

Pattern: 文本字符和正則表達式的元字符組合而成匹配條件

 

grep [options] PATTERN [FILE...]

         -i:忽略大小寫

         --color:匹配到的字符帶顏色

         -v::顯示沒有被模式匹配到的行

         -o:只顯示被模式匹配到的字符串

 

通配符:  

1. *: 任意長度的任意字符

2. ?: 任意單個字符

3. []:

4. [^]:  

 

正則表達式:REGular EXPression, REGEXP

元字符:

1. .: 匹配任意單個字符

2. []: 匹配指定範圍內的任意單個字符

3. [^]:匹配指定範圍外的任意單個字符

         字符集合:[:digit:], [:lower:], [:upper:], [:punct:], [:space:], [:alpha:], [:alnum:]

 

匹配次數(貪婪模式):

1. *: 匹配其前面的字符任意次       

         e.g: 有:a, b, ab, aab, acb, adb, amnb,下面pattern會匹配那些字符串?

                 a*b: b, ab,aab

                 a?b: b, ab

                 a.*b: ab, aab, acb, adb, amnb

 

         .*: 任意長度的任意字符

2. \?: 匹配其前面的字符1次或0次

3. \{m,n\}:匹配其前面的字符至少m次,至多n次

         \{1,\} - 至少1次

         \{0,3\} - 至多3次

 

位置錨定

1. ^: 錨定行首,此字符後面的任意內容必須出現在行首

2. $: 錨定行尾,此字符前面的任意內容必須出現在行尾

    ^$: 空白行

 

3. \<或\b: 錨定詞首,其後面的任意字符必須作爲單詞首部出現

4. \>或\b: 錨定詞尾,其前面的任意字符必須作爲單詞的尾部出現

 

分組:

\(\)

         \(ab\)*:ab作爲整體,出現n次

         後向引用

         \1: 引用第一個左括號以及與之對應的右括號所包括的所有內容

         \2:

         \3:

 

e.g:        

He love his lover.

She like her liker.

He like his lover.

 

grep '\(l..e\).*\1' test.txt 匹配到1, 2行

 

練習:

1、顯示/proc/meminfo文件中以不區分大小的s開頭的行;

grep -i '^s' /proc/meminfo

grep '^[sS]' /proc/meminfo

2、顯示/etc/passwd中以nologin結尾的行;

grep 'nologin$' /etc/passwd

 

取出默認shell爲/sbin/nologin的用戶列表

grep "nologin$' /etc/passwd | cut -d: -f1

 

取出默認shell爲bash,且其用戶ID號最小的用戶的用戶名

grep 'bash$' /etc/passwd | sort -n -t: -k3 | head -1 | cut -d: -f1

 

3、顯示/etc/inittab中以#開頭,且後面跟一個或多個空白字符,而後又跟了任意非空白字符的行;

grep "^#[[:space:]]\{1,\}[^[:space:]]" /etc/inittab

 

4、顯示/etc/inittab中包含了:一個數字:(即兩個冒號中間一個數字)的行;

grep ':[0-9]:' /etc/inittab

 

5、顯示/boot/grub/grub.conf文件中以一個或多個空白字符開頭的行;

grep '^[[:space:]]\{1,\}' /boot/grub/grub.conf

 

6、顯示/etc/inittab文件中以一個數字開頭並以一個與開頭數字相同的數字結尾的行;

grep '^\([0-9]\).*\1$' /etc/inittab

 

練習:

1、找出某文件中的,1位數,或2位數;

grep '[0-9]\{1,2\}' /proc/cpuinfo

grep --color '\<[0-9]\{1,2\}\>' /proc/cpuinfo

 

2、找出ifconfig命令結果中的1-255之間的整數;

需要使用擴展正則表達式

ifconfig | egrep --color '\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-9][0-9])\>'

 

3、查找當前系統上名字爲student(必須出現在行首)的用戶的帳號的相關信息, 文件爲/etc/passwd

grep '^student\>' /etc/passwd | cut -d: -f3

id -u student

 

student1

student2

 

練習:

分析/etc/inittab文件中如下文本中前兩行的特徵(每一行中出現在數字必須相同),請寫出可以精確找到類似兩行的模式:

l1:1:wait:/etc/rc.d/rc 1

l3:3:wait:/etc/rc.d/rc 3

 

grep '^l\([0-9]\):\1.*\1$' /etc/inittab

 

 

05_01_egrep及擴展正則表達式


複習:

REGEXP:REGular EXPression

Pattern:模式

 

正則表達式:

         Basic REGEXP:基本

         Extended REGEXP:擴展

 

基本正則表達式:

.:

[]:

[^]:

 

次數匹配:

*:

\?: 0或1次

\{m,n\}:至少m次,至多n次;

 

.*:

 

錨定:

^:

$:

\<, \b:

\>, \b:

 

\(\)

\1, \2, \3, ...

 

grep:使用基本正則表達式定義的模式來過濾文本的命令;

         -i

         -v

         -o

         --color

         -E: 使用擴展正則表達式

         -A n: 顯示匹配到的行和其後的n行

         -B n: 前的n行

         -C n: 前後各n行

        

擴展正則表達式:省略很多反斜線

 

字符匹配:

.

[]

[^]

 

次數匹配:

*:

?: 

+: 匹配其前面的字符至少1次,\{1,\}

{m,n}: 

 

位置錨定:

^

$

\<

\>

 

分組:

():分組

\1, \2, \3, ...

 

或者

|: or

C|cat:  C或cat, 不是Cat或cat,這個用 '(C|c)at'

 

grep -E = egrep

 

4、顯示所有以數字結尾且文件名中不包含空白的文件;

 bash特性詳解時的未解問題

ls .*[^[[:space:]].*[0-9]$

 

找出/boot/grub/grub.conf文件中1-255之間的數字;

\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>

 

找出ifconfig中的IP地址 

ifconfig | egrep '\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>\.\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>\.\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>\.\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>'

 

ifconfig | egrep --color '(\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>\.){3}\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>'

 

找出ifconfig中的ABC 3類IP地址 

IPv4:

5類:A B C D E

A:1-127

B:128-191

C:192-223

 

\<([1-9]|[1-9][0-9]|1[0-9]{2}|2[01][0-9]|22[0-3])\>(\.\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])\>){2}\.\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])\>

 


馬哥51cto博客: http://mageedu.blog.51cto.com/

 

fgrep: 快速grep, 不支持正則表達式


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章