正則表達式的基礎知識


概念:

正則表達式使用單個字符串來描述、匹配一系列符合某個 句法規則的字符串。

使用場景:

在很多文本編輯器裏,正則表達式通常被用來檢索、替換 那些符合某個模式的文本。

tip

1、處理正則表達式的工具會提供一個忽略大小寫的選項,

2、只使用一個正則表達式,可能不能準確的第篩選,這時,可以採用分支結構,但是分支結構使用過程中,也要注意各個表達式的先後順序;

3、但是正則表達式中並不提供關於數學的任何功能,所以只能使用冗長的分組,選擇,字符類來描述一個正確的IP地址:((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)。

use:

1、\b是正則表達式規定的一個特殊代碼(也叫元字符,metacharacter),代表着單詞的開頭或結尾,也就是單詞的分界處。

    假如你要找的是hi後面不遠處跟着一個Lucy,你應該用\bhi\b.*\bLucy\b。

      \bhi\b

\b[Hh]i\b

\b(H|h)i\b

常用元字符:

wKiom1g68SCwiBvnAAE1dGlnkf4280.png-wh_50

wKioL1g68SKCVwlUAADoJlEkEBs602.png-wh_50

wKiom1g68SOCbsHfAAEEJ27APS8053.png-wh_50

wKioL1g68STh8odnAAFT5Tio35A295.png-wh_50

wKiom1g68SXgLyn1AAFEOxityxA084.png-wh_50

wKiom1g68SbjQ5b0AABH8ujR5Wk710.png-wh_50

wKioL1g68SfBSBUfAAHVQZr2J9w812.png-wh_50

wKiom1g68SnD4ykAAAJCIn2Dd6A752.png-wh_50


spacer.gif

spacer.gif

後向引用用於重複搜索前面某個分組匹配的文本。例如,\1代表分組1匹配的文本。難以理解?請看示例:

\b(\w+)\b\s+\1\b可以用來匹配重複的單詞,像go go, 或者kitty kitty。這個表達式首先是一個單詞,也就是單詞開始處和結束處之間的多於一個的字母或數字(\b(\w+)\b),這個單詞會被捕獲到編號爲1的分組中,然後是1個或幾個空白符(\s+),最後是分組1中捕獲的內容(也就是前面匹配的那個單詞)(\1)。

你也可以自己指定子表達式的組名。要指定一個子表達式的組名,請使用這樣的語法:(?<Word>\w+)(或者把尖括號換成'也行:(?'Word'\w+)),這樣就把\w+的組名指定爲Word了。要反向引用這個分組捕獲的內容,你可以使用\k<Word>,所以上一個例子也可以寫成這樣:\b(?<Word>\w+)\b\s+\k<Word>\b。

spacer.gif



wKioL1g68SqwlUZFAACgFX3cVPQ601.png-wh_50




正則表達式的更深層次東西,我暫且還沒有學到,但是這些基本可以應該可以應付一些基礎的使用!

每日弟子規:

事雖小 勿擅爲 苟擅爲 子道虧

物雖小 勿私藏 苟私藏 親心傷


第五天!

加油!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章