基礎正則表達式字符彙整

我們可以將基礎的正規表示法特殊字符彙整如下:

RE 字符 意義與範例
^word 意義:待搜尋的字串(word)在行首!
範例:搜尋行首爲 # 開始的那一行,並列出行號
grep -n '^#' regular_express.txt
word$ 意義:待搜尋的字串(word)在行尾!
範例:將行尾爲 ! 的那一行列印出來,並列出行號
grep -n '!$' regular_express.txt
. 意義:代表『一定有一個任意字節』的字符!
範例:搜尋的字串可以是 (eve) (eae) (eee) (e e), 但不能僅有 (ee) !亦即 e 與 e中間『一定』僅有一個字節,而空白字節也是字節!
grep -n 'e.e' regular_express.txt
\ 意義:跳脫字符,將特殊符號的特殊意義去除!
範例:搜尋含有單引號 ' 的那一行!
grep -n \' regular_express.txt
* 意義:重複零個到無窮多個的前一個RE 字符
範例:找出含有 (es) (ess) (esss) 等等的字串,注意,因爲 * 可以是 0 個,所以 es也是符合帶搜尋字串。另外,因爲 * 爲重複『前一個 RE 字符』的符號, 因此,在 * 之前必須要緊接著一個 RE字符喔!例如任意字節則爲 『.*』 !
grep -n 'ess*' regular_express.txt
[list] 意義:字節集合的 RE字符,裏面列出想要擷取的字節!
範例:搜尋含有 (gl) 或 (gd) 的那一行,需要特別留意的是,在 [] 當中『謹代表一個待搜尋的字節』, 例如『 a[afl]y』代表搜尋的字串可以是 aay, afy, aly 即 [afl] 代表 a 或 f 或 l 的意思!
grep -n 'g[ld]' regular_express.txt
[n1-n2] 意義:字節集合的 RE字符,裏面列出想要擷取的字節範圍!
範例:搜尋含有任意數字的那一行!需特別留意,在字節集合 [] 中的減號 -是有特殊意義的,他代表兩個字節之間的所有連續字節!但這個連續與否與 ASCII 編碼有關,因此,你的編碼需要配置正確(在 bash當中,需要確定 LANG 與 LANGUAGE 的變量是否正確!) 例如所有大寫字節則爲 [A-Z]
grep -n '[A-Z]' regular_express.txt
[^list] 意義:字節集合的 RE字符,裏面列出不要的字串或範圍!
範例:搜尋的字串可以是 (oog) (ood) 但不能是 (oot) ,那個 ^ 在 [] 內時,代表的意義是『反向選擇』的意思。例如,我不要大寫字節,則爲 [^A-Z]。但是,需要特別注意的是,如果以 grep -n [^A-Z]regular_express.txt 來搜尋,卻發現該文件內的所有行都被列出,爲什麼?因爲這個 [^A-Z]是『非大寫字節』的意思, 因爲每一行均有非大寫字節,例如第一行的 "Open Source" 就有 p,e,n,o....等等的小寫字
grep -n 'oo[^t]' regular_express.txt
\{n,m\} 意義:連續 n 到 m個的『前一個 RE 字符』
意義:若爲 \{n\} 則是連續 n 個的前一個 RE 字符,
意義:若是 \{n,\} 則是連續 n 個以上的前一個 RE 字符!
 範例:在 g 與 g之間有 2 個到 3 個的 o 存在的字串,亦即 (goog)(gooog)
grep -n 'go\{2,3\}g' regular_express.txt

再次強調:『正規表達式的特殊字節』與一般在命令列輸入命令的『萬用字節』並不相同,例如,在萬用字節當中的 * 代表的是『 0 ~ 無限多個字節』的意思,但是在正規表示法當中, * 則是『重複 0 到無窮多個的前一個RE 字符』的意思~使用的意義並不相同,不要搞混了!

發佈了46 篇原創文章 · 獲贊 5 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章