正則表達式

正則表達式作用:能夠與多種字符匹配的表達式

正則表達式的優勢和用途:

1、一種強大而領活的文本處理工具

2、大部分編程語言、數據庫、文本編輯器、開發環境都支持正則表達式。


標準字符集合 (區分大小寫,大寫表示相反的意思)

\d   任意一個數字,0~9中的任意一個值

\w  任意一個字母或數字或下劃線,也就是A~Z,a~z,0~9,_中任意一個

\s   包括空格、製表符、換行符等空白字符的其中任意一個

.     小數點可以匹配任意一個字符(除了換行符)如果要匹配括號"\n"在內的所有字符,一般用[\s\S]


自定義字符集合:[] 中括號匹配方式,能夠匹配中括號中任意一個字符

[abc@]   匹配“a” 或 “b” 或 “c” 或 “@”

[^abc]     匹配“a”,“b”,“c” 之外的任意一個字符

[f-k]         匹配“f”~“k”之間的任意一個字符

[^A-Z6-9]   匹配“A”~“Z”,“6”~“9”之外的任意一個字符,除了^,-之外


正則表達式的特殊符號,被包含到中括號中,則失去特殊意義


量詞:修飾匹配次數的特殊符號

{n}           表達式重複n次

{m,n}       表達式至少重複m次,最多重複n次

{m,}         表達式至少重複m次,最多不限制

?             表達式0次或者1次,相當於{0,1}

+             表達式至少出現1次,相當於{1,}

*              表達式不出現或者出現任意次數,相當於{0,}


匹配次數中的貪婪模式(匹配字符越多越好,默認是貪婪模式)

匹配次數中的非貪婪模式(匹配字符越少越好,修飾匹配次數的特殊符號後再加上一個“?”)


字符邊界 (標記匹配的不是字符而是位置,符合某種條件的位置)

^              與字符串開始的地方匹配

$              與字符串結束的地方匹配

\b             匹配一個單詞的邊界


------\b匹配的是:前面的字符和後面的字符不全是\w


正則表達式的匹配模式

IGNORECASE忽略大小寫模式

1、匹配時忽略大小寫

2、默認情況下,正則表達式是區分大小寫的

SINGLELINE 單行模式

1、整個文本看作是一個字符串,只有一個開頭,一個結尾

2、使用小數點“.”  可以匹配包含換行符“\n”在內的任意字符

MULTILINE多行模式

1、每行都是一個字符串,都有開頭和結尾

2、在指定了MULTILINE後,如果需要只匹配字符串的開始和結束位置,可以使用\A和\Z


選擇符和分組

|       左右兩邊表達式之間“或”的關係,匹配左邊或者右邊

        1、在被修飾匹配次數的時候,括號中的表達式可以作爲整體被修飾

()      2、取匹配結果的時候,括號中的表達式匹配到的內容可以被單獨得到

        3、每一堆括號會分配一個編號,使用()得捕獲根據做括號得順序從1開始自動編號。捕獲元素編號爲零的第一個捕獲是由整個表達式模式匹配的文本()  

(?:Expression)   一些表達式中,不得不使用(),但又不需要保存()中子表達式匹配的內容,這時可以使用非捕獲組來低消使用()帶來的副作用


反向引用(\nnn)

每一對()會分配一個編號,使用()的捕獲根據做括號的順序從一開始自動編號。

通過反向引用,可以對分組已捕獲的字符串進行引用








   


發佈了49 篇原創文章 · 獲贊 17 · 訪問量 3萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章