Regular Expression基礎解析正則表達式

第一個“\”
這個是俗稱轉義字符,就是把一個字符標記爲一個特殊字符或者原義字符。如:“n” 就是匹配“n”  。如果是“\n”  則是換行符。
有人該問了如果我就是想寫“\”這個斜槓呢? 這個也很簡單啊!就直接是這樣寫“\\”就可以了!爲什麼寫兩個“\\”呢!就是爲了區分。

第二個“^”
這個是俗稱開始字符,就是說準備寫正則了!如果設置了RegExp對象的Multiline屬性,^也匹配“\n”或者“\r”之後的位置。

第三個“$”
這個是俗稱結束字符,也可以說成收尾(很不專業的解釋)!如果設置了RegExp對象的Multiline屬性,$也匹配“\n”或“\r”之前的位置。

第四個“*”
這個是匹配前面的子表達式零次或者多次。如:zo*能匹配“z”以及“zo”或者“zoo”。這個“*”也就是相當於{0,}

第五個“+”
這個是匹配前面的子表達式一次或者多次。如:“zo+”能匹配“zo”以及“zoo”或者“zooo”。這個“*”和“+”差不多一個是開始零次一個是一次。這個“+”相當於{1,}。

第六個“?”
這個是匹配前面的子表達式零次或者一次。如:“do(es)?”可以匹配“do”或者“does”。這個問號的意思就是要麼匹配零次要麼匹配一次!


第七個“{}”
這個符號是匹配多少次的,
1,{n}匹配確定的n次,n是一個非負整數,如:“o{2}”這個的意思就是匹配兩個“oo”, 如: good,food等!不過不能匹配body,因爲就一個o!
2,{n,}匹配至少n次,n是個非負整數,如:“o{2,}” 這個的意思就是匹配兩個以上的“oo”,如:good,goood,gooood等。“o{1,}”等價於“o+”。“o{0,}”這個等價於“o*”。
3,{n,m}這個是最少匹配n次最多匹配m次,n和m都是非負整數,其中n<=m。例如:“o{1,3}”匹配body,food,foood。不過不匹配fooood。“o{0,1}”等價於“o?”。這裏寫的時候要注意一下,就是逗號和兩個數之間不能有空格。

第八個“?”特殊用法
當該字符緊跟在任何一個其他限制符(*,+,?,{n},{n,},{n,m})後面時,匹配模式是非貪婪的。所謂非貪婪就是以最少爲好,非貪婪模式儘可能少的匹配所搜索的字符串,而默認的貪婪模式則儘可能多的匹配所搜索的字符串。例如,對於字符串“oooo”,“o+?”將匹配單個“o”,而“o+”將匹配所有“o”。

第九個“.”
匹配除換行符“\n”之外的任何單個字符。如果想匹配換行符“\n”再內的任何字符,就使用“(.|\n)”的模式。

第十個“pattern”
這個“pattern”不是很好理解,剛一看比較暈!不過我對這個的理解如下希望對大家有用:
1. ?:pattern 匹配pattern但不獲取匹配結果, 例如:k(?:1|2|3) k在123中任意匹配一個,例子:k1|k2
2. ?=pattern 正向肯定預查 例如:K(?=1|2|3) 當K匹配123中任意一個時 選擇K  例子:k1中的k或者k2中的k
3. ?!pattern 正向否定預查 例如:k(?!1|2|3) 當K不匹配123中的任意一個時 選擇K 例子:不匹配k1中的k,不過可以是k4,k5
4. ?<=pattern 反向肯定預查 例如:(?<=1|2|3)k 當K匹配123中任意一個時 選擇K 例子:1k中的k或者2k中的K
5. ?<!pattern 反向否定預查 例如:(?<!1|2|3)k 當k不匹配123中任意一個時 例子:不匹配1k中的K可以是4k,5k

第十一個“|”
這個符號就是或的意思,比如:“f|good”能匹配“f”或“good”,如果這樣呢“(f|g)ood”則匹配“food”或“good”。

第十二個“[]”
這個符號是字符集和的意思,和“{}”看上去差不多,不過意義可就差多了。


第十三個“()”
這個符號式數組或者是集合(這樣解釋可能不太準確,呵呵)。

1.[xyz]  匹配所包含的任意一個字符。就是說三個之中選擇一個。例子:“[abc]”可以匹配“company”中的“a”不過不可以匹配“beautiful”因爲用到了裏面的兩個字母。
2.[^xyz] 這個是負值字符集合,也可以說成是“非”。例子:“[^abc]”可以匹配“drop”等!只要單詞裏沒有“abc”這三個字母就可以。
3.[a-z] 字符的範圍。匹配指定範圍內的任意字符。例如,“[a-z]”可以匹配“a”到“z”範圍內的任意小寫字母字符。也可以寫成“[0-9]”這個是匹配0到9直接打數字。
4.[^a-z] 這個我想不用說大家就應該想到是什麼意思了,對了!就是你想的那個意思:不在“a”到“z”範圍內的任意字符,一開始我看到這個的時候以爲是不在a到z之間的字母呢!我說如果不在a到z之間的字母那只有漢語中的“ü” 了!這個好像讀“喻”!呵呵! 大家看清楚了啊!是字符,不是字母。

下面大家和我一起看看“\”和字母所匹配的特殊含義,
“\b” 這個是匹配一個單詞的邊界,也就是指單詞和空格間的位置。例如,“er\b”可以匹配“never”中的“er”,但不能匹配“verb”中的“er”。這個我感覺比較好記大家可以這樣記:邊界的邊是b開頭的!
“\B”這個是和“\b”是相反的,匹配非單詞邊界。“er\B”能匹配“verb”中的“er”,但不能匹配“never”中的“er”。
“\d”這個是用的比較多!我建議大家對這個多記記,這個是匹配數字字符,相當於[0-9]。
“\D”這個也很好理解,也是相反的意思就是說不是數字的,相當於[^0-9]。
“\f”這個是匹配一個換頁符。這個不做過多解釋了!下面的四個也就過多不做過多解釋了。只要記住就可以了!在項目中會用就可以了!
“\n”這個是匹配一個換行符。
“\r”這個是匹配一個回車符。
“\t”這個是匹配一個製表符。
“\v”這個是匹配一個垂直製表符。
“\s”這個匹配任何空字符,匹配任何空白字符,包括空格、製表符、換頁符等等。等價於[ \f\n\r\t\v]。也就是這個把上面的五個都包括了!
“\S”這個是非空白字符等價於[^ \f\n\r\t\v]。
說到這裏大家都可能感覺到正則其實就是這些字符嘛!而且有些是可以靠我們的邏輯思維推理出來的,而且有些是重複的,只要大家能夠靈活的運用就可以了。
好的,我們繼續
“\w”這個是匹配包括下劃線的任何單詞字符。等價於“[A-Za-z0-9_]”。這個在實際中用的也挺多的也建議大家多記記這個。
“\W”這個是匹配非單詞數字字符。等價於“[^A-Za-z0-9_]”。


好的!基本上要記得就是這麼多了!這些可能有些正則高手該說了“你這個根本不全啊?” 呵呵! 我先提前解釋一下吧,我所寫的只是一些基礎的,在項目中常見的,比較實用的,基本上這些在項目中就可以運用自如了。
接下來呢,和大家做一些實質性的東西,和大家一起解析一些正則表達式。
比如這個正則:^([0-1]?[0-9]|2[0-3]):([0-5][0-9]):([0-5][0-9])$
這個正則我想對正則高手來說一看就知道是什麼了。當然一些邏輯思維比較強的看兩眼也就知道這個是什麼了,沒錯就是時間正則。

OK 我們來解析一下這個正則從這個“^”開始,“([0-1]?[0-9]|2[0-3])”是個組,“[0-1]?”這個問號的作用是0或1最多有零個或者一個,“[0-9]”0至9之間任意一個數,“|”這個是“或”的意思,就是說不是“[0-1]?[0-9]”就是“2[0-3]”,“2[0-3]” 這個是前面的2就是代表2,後面0至3是0到3之間任意一個數,“:”就是代表“:”,“([0-5][0-9])”也是個組,“[0-5]”是0到5之間任意一個數,“[0-9]”是0到9之間任意一個數,“:”也是本意,“([0-5][0-9])”也是個組,“[0-5]”是0到5之間任意一個數,“[0-9]”是0到9之間任意一個數,“$”這個是結束符。
再和大家解析一個小數
比如:^[1-9]+\d*(\.[0-9]{1,2})?|0(\.[0-9]{1,2})?$
“^”是開始符,“[1-9]+”其中“+”的意思是1到9之間最少有一個或者多個,“\d*”這個“\d”是數字,這個“*”是最少有零個數字或者有多個數字,“(\.[0-9]{1,2})?”這個組裏面“\.”是原意點,“[0-9]{1,2}” 0到9之間有一個或者有兩個數字,後面這個問號“?”意思是有零個或者一個它“(\.[0-9]{1,2})”。“|” 是要麼是“[1-9]+\d*(\.[0-9]{1,2})?”要麼是“0(\.[0-9]{1,2})?”。“0(\.[0-9]{1,2})?”這個裏面的0是原意,“(\.[0-9]{1,2})?”這個組裏面“\.”是原意點,“[0-9]{1,2}” 0到9之間有一個或者有兩個數字,後面這個問號“?”意思是有零個或者一個它“(\.[0-9]{1,2})”。

好了,我就不一個一個的解析了,如果我這樣解析下去估計大家都該把我當成“唐僧”了。今天就和大家分享到這裏,還是那就老話歡迎高手批評指點,有看法不同的請留言討論。
下面我例舉出一些常見的正則表達式來給大家說拜拜:

^[1-9]\d*$ //匹配正整數   
^-[1-9]\d*$ //匹配負整數   
^-?[1-9]\d*$ //匹配整數   
^[1-9]\d*|0$ //匹配非負整數(正整數 + 0)   
^-[1-9]\d*|0$ //匹配非正整數(負整數 + 0)   
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ //匹配正浮點數   
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ //匹配負浮點數   
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ //匹配浮點數   
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$ //匹配非負浮點數(正浮點數 + 0)   
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$ //匹配非正浮點數(負浮點數 + 0)
^[a-zA-Z][a-zA-Z0-9_]{4,15}$  //匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線)
^\s*|\s*$  //匹配首尾空白字符的正則表達式
\n\s*\r  //匹配空白行的正則表達式
[^\x00-\xff]  //匹配雙字節字符(包括漢字在內)
[\u4e00-\u9fa5]  //匹配中文字符的正則表達式


用戶名
^[a-z0-9_-]{3,16}$

密碼
^[a-z0-9_-]{6,18}$

十六進制值
^#?([a-f0-9]{6}|[a-f0-9]{3})$

電子郵箱
^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$
^[a-z\d]+(\.[a-z\d]+)*@([\da-z](-[\da-z])?)+(\.{1,2}[a-z]+)+$

URL
^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$

IP 地址
((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)


^(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$

HTML 標籤
^<([a-z]+)([^<]+)*(?:>(.*)<\/\1>|\s+\/>)$

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章