Linux正则表达式详解_GREP

正则表达式( Regular Expression,RE )

　　1 什么是正则表达式：

　　什么是正规表示式 ( Regular Expression, 底下简称 RE ) 呢？简单的说，在 Linux 的环境下，我们可以通过“字符串以及一些特殊字符的辅助“来进行文字的比对工作，好让使用者筛选自己所需要数据。

　　这些特殊的字符与搭配使用的工具，就构成了正则表达式的基础!

一．GREP和EGREP支持的正则表达式

正则表达式元字符集（基本集）

元字符

意义与范例

锚定行的开始，待查找字符串开头的行！

范例：grep -n '^#' regular_express.txt 查找

行首为 # 开始的那一行！

锚定行的结束，待查找字符串结尾的行！

范例：grep -n '!$' regular_express.txt 将

行尾为 ! 的那一行打印出来！

匹配任意一个非换行符的字符。

一定是一个任意字符！

范例：grep -n 'e.e' regular_express.txt

查找的字符串可以是 (eve) (eae) (eee) (e e)，但不能仅有 (ee) ！亦即 e 与 e 中间『一定』仅有一个字符，而空格符也是字符！

跳脱字符，将特殊符号的特殊意义去除！

范例：grep -n \' regular_express.txt 查找

含有单引号 ' 的那一行！

匹配零个或多个先前字符。

范例：grep -n 'ess*' regular_express.txt

表示找出含有 (es) (ess) (esss) 等等的字符串，注意，因为 * 可以是 0 个，所以 es 也是符合带查找字符串。

另外，因为 * 为重复『前一个 RE 字符』的符号，因此，在 * 之前必须要紧接着一个 RE 字符喔！例如任意字符则为『.*』！

x\{n,m\}

x\{m\}

x\{m,\}

x\{n,m\} 重复字符x，至少n次，不多于m次。

x\{m\} 重复字符x，m次。

x\{m,\} 重复字符x,至少m次。

范例：如：'o\{5\}'匹配包含5 个o的行。

如：'o\{5,\}'匹配至少有5 个o的行。

如：'o\{5,10\}'匹配5--10 个o的行。

[ ]

字符集合的 RE 特殊字符的符号

[list]

范例：grep -n 'g[ld]' regular_express.txt 查找含有 (gl) 或 (gd) 的那一行～需要特别留意的是，在 [] 当中『谨代表一个待查找的字符』，例如： a[afl]y 代表查找的字符串可以是 aay, afy, aly 亦即 [afl] 代表 a 或 f 或 l 的意思！

[ch1-ch2]

范例：grep -n '[0-9]' regular_express.txt 查找含有任意数字的那一行！需特别留意，在字符集合 [] 中的减号 - 是有特殊意义的，他代表两个字符之间的所有连续字符！但这个连续与否与 ASCII 编码有关，因此，您的编码需要设定正确(在 bash 当中，需要确定 LANG 与 LANGUAGE 的变量是否正确！) 例如所有大写字符则为 [A-Z]

[^]

范例：grep -n 'oo[^t]' regular_express.txt 查找的字符串可以是 (oog) (ood) 但不能是 (oot) ，那个 ^ 在 [] 内时，代表的意义是『反向选择』的意思～例如，我不要大写字符，则为 [^A-Z] ～但是，需要特别注意的是，如果以 grep -n [^A-Z] regular_express.txt 来查找，却发现该档案内的所有行都被列出，为什么？因为这个 [^A-Z] 是『非大写字符』的意思，因为每一行均有非大写字符，例如第一行的 "Open Source" 就有 p,e,n,o.... 等等的小写字符，以及双引号 (") 等字符，所以当然符合 [^A-Z] 的查找！

$…$

1.多个重复群组，如 'g$la|oo$d' 匹配 (glad) 或 (good)。

2.标记匹配字符，如 '$love$'，love 被标记为1。

格式：$…$…\n n为数字。

范例：grep 'w$es$t.*\1' filename

如果west被匹配，则es就被存储到内存中，并标记为1，然后搜索任意个字符（.*），这些字符后面紧跟着另外一个es（\1），找到就显示该行。

常用于sed 命令中与 s（替换）参数配合使用。

锚定单词的开始。

如:'\<grep'匹配包含以grep开头的单词的行。

锚定单词的结束。

如:'grep\>'匹配包含以grep结尾的单词的行。

匹配文字和数字字符，也就是[A-Za-z0-9]

如：'G\w*p'匹配以G 后跟零个或多个文字或数字字符，然后是p。

\w的反置形式，匹配一个或多个非单词字符，如点号、句号等标点符号。

单词锁定符，如: '\bgrepb\'只匹配grep。

正则表达式元字符集（扩展集）

扩展正则表达式: egrep = grep -E

元字符

意义与范例

匹配一个或多个先前的字符

范例：egrep -n 'go+d' regular_express.txt 搜寻 (god) (good) (goood)... 等等的字符串。

那个 o+ 代表『一个以上的 o 』所以，上面的执行成果会将第 1, 9, 13 行列出来。

『零个或一个』的前一个 RE 字符

范例：egrep -n 'go?d' regular_express.txt 搜寻 (gd) (god) 这两个字符串。

那个 o? 代表『空的或 1 个 o 』所以，上面的执行成果会将第 13, 14 行列出来。

这两个案例( 'go+d' 与 'go?d' )的结果集合与 'go*d' 相同。

用或( or )的方式找出数个字符串

范例：egrep -n 'gd|good' regular_express.txt

查找 gd 或 good 这两个字符串。

注意：是“或”的关系。

( )

找出『群组』字符串

同标准正则表达式中的 \(…\ )。egrep就不用"\"号进行转义。

范例：egrep -n 'g(la|oo)d' regular_express.txt

查找 (glad) 或 (good) 这两个字符串。

还可以用来作为『多个重复群组』的判别

例： echo 'AxyzxyzxyzxyzC' | egrep 'A(xyz)+C'

找开头是 A 结尾是 C ，中间有一个以上的 "xyz" 字符串。

{…}

同标准正则表达式中的 \{…\}。Egrep 就不用“\”号进行转义。

POSIX 字符类

为了在不同国家的字符编码中保持一至，POSIX(The Portable Operating System Interface)增加了特殊的字符类，如[:alnum:]是A-Za-z0-9的另一个写法。要把它们放到[]号内才能成为正则表达式，如[A- Za-z0-9]或[[:alnum:]]。在linux 下的grep 除fgrep外，都支持POSIX的字符类。

[:alnum:] 文字数字字符

[:alpha:] 文字字符

[:digit:] 数字字符

[:graph:] 非空字符（非空格、控制字符）

[:lower:] 小写字符

[:cntrl:] 控制字符

[:print:] 非空字符（包括空格）

[:punct:] 标点符号

[:space:] 所有空白字符（新行，空格，制表符）

[:upper:] 大写字符

[:xdigit:] 十六进制数字（0-9，a-f，A-F）

Grep 命令选项

-a ：表示以文本文件方式搜索。

-c ：表示计算找到符合行的次数。（行数）

-i ：表示忽略大小写。

-n ：表示顺便输出行号。

-v ：反向选择，即找到没有搜索字符串的行。

-l ：显示出匹配字符串的文件名称。

-w ：如果被\<和\>引用，就把表达式做为一个单词搜索。

--color 颜色标注。

Linux正则表达式详解_GREP

记一次 .NET某工业设计软件崩溃分析

创建 Vue3 项目

TS + Webpack 整合 Jest

分享5款.NET开源免费的Redis客户端组件库

安卓手机如何登录抖音境外版

golang开发 gorilla websocket的使用

面试官：如果不允许线程池丢弃任务，应该选择哪个拒绝策略？

Mac卸载 Node npm，升级 Node

嵌入式汽车电子学习路线

uni.showModel内容换行

RHEL5.4_X86_X64安裝Oracle_10g筆記

Linux時間設置-date-筆記

Linux正則表達式詳解_GREP

正則表達式之零寬斷言

Linux 內核參數設置於詳解 --Oracle 安裝

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結