概念:
正則表達式使用單個字符串來描述、匹配一系列符合某個 句法規則的字符串。
使用場景:
在很多文本編輯器裏,正則表達式通常被用來檢索、替換 那些符合某個模式的文本。
tip
1、處理正則表達式的工具會提供一個忽略大小寫的選項,
2、只使用一個正則表達式,可能不能準確的第篩選,這時,可以採用分支結構,但是分支結構使用過程中,也要注意各個表達式的先後順序;
3、但是正則表達式中並不提供關於數學的任何功能,所以只能使用冗長的分組,選擇,字符類來描述一個正確的IP地址:((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)。
use:
1、\b是正則表達式規定的一個特殊代碼(也叫元字符,metacharacter),代表着單詞的開頭或結尾,也就是單詞的分界處。
假如你要找的是hi後面不遠處跟着一個Lucy,你應該用\bhi\b.*\bLucy\b。
\bhi\b
\b[Hh]i\b
\b(H|h)i\b
常用元字符:
後向引用用於重複搜索前面某個分組匹配的文本。例如,\1代表分組1匹配的文本。難以理解?請看示例:
\b(\w+)\b\s+\1\b可以用來匹配重複的單詞,像go go, 或者kitty kitty。這個表達式首先是一個單詞,也就是單詞開始處和結束處之間的多於一個的字母或數字(\b(\w+)\b),這個單詞會被捕獲到編號爲1的分組中,然後是1個或幾個空白符(\s+),最後是分組1中捕獲的內容(也就是前面匹配的那個單詞)(\1)。
你也可以自己指定子表達式的組名。要指定一個子表達式的組名,請使用這樣的語法:(?<Word>\w+)(或者把尖括號換成'也行:(?'Word'\w+)),這樣就把\w+的組名指定爲Word了。要反向引用這個分組捕獲的內容,你可以使用\k<Word>,所以上一個例子也可以寫成這樣:\b(?<Word>\w+)\b\s+\k<Word>\b。
正則表達式的更深層次東西,我暫且還沒有學到,但是這些基本可以應該可以應付一些基礎的使用!
每日弟子規:
事雖小 勿擅爲 苟擅爲 子道虧
物雖小 勿私藏 苟私藏 親心傷
第五天!
加油!