grep、egrep、正则表达式

 

总结本此课程中所涉及命令的使用方法及相关示例展示;

grep的使用

            grep: Global search REgular expression and Print out theline.

        作用:文本搜索工具,根据用户指定的“模式(pattern)”逐行去搜索目标文本,打印匹配到的行;

        模式:由正则表达式的元字符及文本字符所编写的过滤条件;

            元字符:字符不表示其字面意义,而用于表示通配或控制功能;

        分两类:

            基本正则表达式:BRE

            扩展正则表达式:ERE

            正则表达式引擎;

    grep [OPTIONS] PATTERN [FILE...]

        选项:

            --color=auto:对匹配到的串做高亮显示;

            -v:显示模式匹配不到行;

            -i: 忽略字符大小写;

            -o: 仅显示能够被模式匹配到的串本行;

            -q: 静默模式;

            -E:使用扩展的正则表达式;

总结基本正则表达式及扩展正则表达式

字符匹配:

        .: 匹配任意单个字符;

        []:匹配指定范围内的任意单个字符;

        [^]:匹配指定范围内的任意单个字符;

[:lower:] 匹配小写字母

    [:upper:] 匹配大写字母

    [:alpha] 匹配所有字母

     [:digit:]匹配所有数字

    [:alnum:] 匹配所有数字字母 [:alpha:]和[:alpha:]和二为一

    [:space] 代表空格字符 例如:tab,换行,空格之类的

[:punct:] 代表标点符号例如:'! " # $ %& ' ( ) * + , - . / : ; < = > ? @ [ ] ^ _ ' { | }

 

次数匹配:用于要指定其次数的字符的后面;

                *: 任意次;

\?:0或1次;

                grep "x\?y"

                \+:1或多次;

                \{m\}:精确限制为m次;

                \{m,n\}: 至少m次,至多n次,[m,n]

                    \{0,n\}:至多n次;

                    \{m,\}:至少m次;

.*: 匹配任意长度的任意字符;

位置锚定:

                ^: 行首锚定;用于模式的最左侧;

                $: 行尾锚定;用于模式的最右侧;

                \<, \b: 词首锚定;用于表示单词的模式的左侧;

                \>, \b:词尾锚定;用于表示单词的模式的右侧;

                ^$: 空白行;

            分组:\(\)

                分组的小括号中的模式匹配到的内容,会在执行过程中被正则表达式引擎记录下来,并保存内置的变量中;这些变量分别是\1, \2, ...

                    \1: 从左侧起,第一个左括号,以及与之配对的右括号中间的模式所匹配到的内容;

                    \2

                后向引用:使用变量引用前面的分组括号中的模式所匹配到的字符;

 

扩展的正则表达式:

        grep家庭有三个命令:

            grep:基本正则表达式

                -E: 扩展正则表达式

                -F:不支持正则表达式

            egrep:扩展正则表达式

            fgrep:不支持正则表达式

 

扩展正则表达式的元字符:

            字符匹配:

                .: 任意单个字符

                []:指定范围内的任意单个字符

                [^]:指定范围外的任意单个字符

            次数匹配:

                *匹配其前面的字符任意次

                ?: 0次或1次;

                +: 1次以上;

                {m}: 精确匹配m次;

                {m,n}: 至少m次,至多n次;

            锚定:

                ^: 锚定行首

                $: 锚定行尾

                \<, \b

                \>, \b

            分组:()

                后向引用:\1, \2, ...

            或者:

                a|b

                    C|cat: 不表示Cat或cat,而表示C或cat;

                        要写成(C|c)at

 

                   练习:

1、  显示/etc/passwd文件中以bash结尾的行;

[root@localhost~]# grep 'b..h$' /etc/passwd
root:x:0:0:root:/root:/bin/bash
[root@localhost~]# grep .bash$ /etc/passwd
root:x:0:0:root:/root:/bin/bash
[root@localhost~]# grep 'bash$' /etc/passwd
root:x:0:0:root:/root:/bin/bash

2、  显示/etc/passwd文件中的两位数或三位数;

[root@localhost~]# grep '[0-9]\{2,3\}' /etc/passwd
[root@localhost~]# grep --color=auto -E '\b[[:digit:]]{2,3}\b' /etc/passwd

3、  显示'netstat-tan'命令结果中以‘LISTEN’后跟0个、1个或多个空白字符结尾的行;

[root@localhost~]# netstat -tan | grep --color=auto -E 'LISTEN[[:space:]]*$'
tcp        0     0 0.0.0.0:47425              0.0.0.0:*                   LISTEN    
tcp        0     0 0.0.0.0:111                0.0.0.0:*                   LISTEN    
tcp        0     0 0.0.0.0:22                 0.0.0.0:*                   LISTEN    
tcp        0     0 127.0.0.1:631              0.0.0.0:*                   LISTEN    
tcp        0     0 127.0.0.1:25               0.0.0.0:*                   LISTEN    
tcp        0     0 :::45984                   :::*                        LISTEN    
tcp        0     0 :::111                     :::*                        LISTEN    
tcp        0     0 :::22                      :::*                        LISTEN    
tcp        0     0 ::1:631                    :::*                        LISTEN    
tcp        0     0 ::1:25                     :::*                        LISTEN    
[root@localhost~]#

 

                            4、添加用户bashtestbash,basher以及nologin用户(nologin用户的shell/sbin/nologin);而后找出/etc/passwd文件中用户名同shell名的行;

 

[root@localhost ~]# useradd bash
[root@localhost ~]# useradd testbash
[root@localhost ~]# useradd basher
[root@localhost ~]# useradd -s/sbin/nologin nologin
[root@localhost ~]# grep --color=auto -E'^([[:alnum:]]+):.*\1$' /etc/passwd
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
bash:x:500:500::/home/bash:/bin/bash
nologin:x:503:503::/home/nologin:/sbin/nologin

练习:

1、  显示当前系统上rootcentosuser1用户的默认的shellUID

[root@localhost ~]# useradd centos
[root@localhost ~]# useradd user1
[root@localhost ~]# egrep'^\<root|centos|user1\>' /etc/passwd | cut -d: -f3,7
0:/bin/bash
504:/bin/bash
505:/bin/bash
[root@localhost ~]#

2、  找出/etc/rc.d/init.d/functions文件中某单词(单词中间可以存在下划线)后面跟着一组小括号的行;

[root@localhost ~]# grep -E'\<[0-9a-zA-Z_]+\>\(\)' /etc/rc.d/init.d/functions
[root@localhost ~]# egrep -E'\<[[:alpha:]_]+\>\(\)' /etc/rc.d/init.d/functions
[root@localhost ~]# egrep '[a-z].*\(\)'/etc/init.d/functions
[root@localhost ~]# egrep'[[:alpha:]].*\(\)' /etc/init.d/functions

                            3、使用echo输出一个路径,而后egrep找出其路径基名;

 

                                     进一步地:使用egrep取出其目录名;

路径基名命令

[root@localhost ~]# echo/etc/sysconfig/iptables-config anaconda-ks.cfg |egrep -o '([^/]*)$'
iptables-config anaconda-ks.cfg
[root@localhost ~]#

路径目录名命令:

[root@localhost ~]# echo /etc/sysconfig/iptables-configanaconda-ks.cfg |egrep -o '^(.*)/'
/etc/sysconfig/
[root@localhost ~]#

 

3、  找出ifconfig命令执行结果中1-255之间的数字;

 

[root@localhost ~]# ifconfig |grep'[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}' --colo

         inet addr:192.168.1.11 Bcast:192.168.1.255 Mask:255.255.255.0

         inet addr:127.0.0.1 Mask:255.0.0.0

 

[root@localhost ~]# ifconfig | grep--color=auto '\([0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\)'

         inet addr:192.168.1.11 Bcast:192.168.1.255 Mask:255.255.255.0

         inet addr:127.0.0.1 Mask:255.0.0.0

 

[root@localhost ~]#  ifconfig | egrep --color=auto'\<([1-9]|[0-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>'

eth0     Link encap:Ethernet  HWaddr00:0C:29:D2:7E:71 

         inet addr:192.168.1.11 Bcast:192.168.1.255 Mask:255.255.255.0

         inet6 addr: fe80::20c:29ff:fed2:7e71/64 Scope:Link

         UP BROADCAST RUNNING MULTICAST MTU:1500  Metric:1

         RX bytes:187779 (183.3 KiB)  TXbytes:133085 (129.9 KiB)

         inet addr:127.0.0.1 Mask:255.0.0.0

         inet6 addr: ::1/128 Scope:Host

         UP LOOPBACK RUNNING MTU:65536  Metric:1

         RX packets:8 errors:0 dropped:0 overruns:0 frame:0

         TX packets:8 errors:0 dropped:0 overruns:0 carrier:0


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章