正則其實也勢利,削尖頭來把錢揣; (指開始符號^和結尾符號$)
特殊符號認不了,弄個倒槓來引路; (指\. \*等特殊符號)
倒槓後面跟小w, 數字字母來表示; (\w跟數字字母;\d跟數字)
倒槓後面跟小d, 只有數字來表示;
倒槓後面跟小a, 報警符號嘀一聲;
倒槓後面跟小b, 單詞分界或退格;
倒槓後面跟小t, 製表符號很明瞭;
倒槓後面跟小r, 回車符號知道了;
倒槓後面跟小s, 空格符號很重要;
小寫跟罷跟大寫,多得實在不得了;
倒槓後面跟大W, 字母數字靠邊站;
倒槓後面跟大S, 空白也就靠邊站;
倒槓後面跟大D, 數字從此靠邊站;
倒框後面跟大B, 不含開頭和結尾;
單個字符要重複,三個符號來幫忙; (* + ?)
0 星加1 到無窮,問號只管0 和1; (*表0-n;+表1-n;?表0-1次重複)
花括號裏學問多,重複操作能力強; ({n} {n,} {n,m})
若要重複字符串,園括把它括起來; ((abc){3} 表示字符串“abc”重複3次 )
特殊集合自定義,中括號來幫你忙;
轉義符號行不通,一個一個來排隊;
實在多得排不下,橫槓請來幫個忙; ([1-5])
尖頭放進中括號,反義定義威力大; ([^a]指除“a”外的任意字符 )
1豎作用可不小,兩邊正則互替換; (鍵盤上與“\”是同一個鍵)
1豎能用很多次,複雜定義很方便;
園括號,用途多;
反向引用指定組,數字排符對應它; (“\b(\w+)\b\s+\1\b”中的數字“1”引用前面的“(\w+)”)
支持組名自定義,問號加上尖括號; (“(?<Word>\w+)”中把“\w+”定義爲組,組名爲“Word”)
園括號,用途多,位置指定全靠它;
問號等號字符串,定位字符串前面; (“\b\w+(?=ing\b)”定位“ing”前面的字符串)
若要定位串後面,中間插個小於號; (“(?<=\bsub)\w+\b”定位“sub”後面的字符串)
問號加個驚歎號,後面跟串字符串;
PHPer都知道, !是取反的意思;
後面不跟這一串,統統符合來報到; (“\w*d(?!og)\w*”,“dog”不符合,“do”符合)
問號小於驚歎號,後面跟串字符串;
前面不放這一串,統統符合來報到;
點號星號很貪婪,加個問號不貪婪;
加號問號有保底,至少重複一次多;
兩個問號老規矩,0次1次團團轉;
花括號後跟個?,貪婪變成不貪婪;
還有很多裝不下,等着以後來增加
1。^\d+$ //匹配非負整數(正整數 + 0)
2。^[0-9]*[1-9][0-9]*$ //匹配正整數
3。^((-\d+) ?(0+))$ //匹配非正整數(負整數 + 0)
4。^-[0-9]*[1-9][0-9]*$ //匹配負整數
5。^-?\d+$ //匹配整數
6。^\d+(\.\d+)?$ //匹配非負浮點數(正浮點數 + 0)
7。^(([0-9]+\.[0-9]*[1-9][0-9]*) ?([0-9]*[1-9][0-9]*\.[0-9]+) ?([0-9]*[1-9][0-9]*))$ //匹配正浮點數
8。^((-\d+(\.\d+)?) ?(0+(\.0+)?))$ //匹配非正浮點數(負浮點數 + 0)
9。^(-(([0-9]+\.[0-9]*[1-9][0-9]*) ?([0-9]*[1-9][0-9]*\.[0-9]+) ?([0-9]*[1-9][0-9]*)))$ //匹配負浮點數
10。^(-?\d+)(\.\d+)?$ //匹配浮點數
11。^[A-Za-z]+$ //匹配由26個英文字母組成的字符串
12。^[A-Z]+$ //匹配由26個英文字母的大寫組成的字符串
13。^[a-z]+$ //匹配由26個英文字母的小寫組成的字符串
14。^[A-Za-z0-9]+$ //匹配由數字和26個英文字母組成的字符串
15。^\w+$ //匹配由數字、26個英文字母或者下劃線組成的字符串
17。^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$ //匹配url
18。匹配中文字符的正則表達式: [\u4e00-\u9fa5]
19。匹配雙字節字符(包括漢字在內):[^\x00-\xff]
20。應用:計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1)
String.prototype.len=function(){return this.replace([^\x00-\xff]/g,”aa”).length;}
21。匹配空行的正則表達式:\n[\s ? ]*\r
22。匹配HTML標記的正則表達式:/ <(.*)>.* <\/\1> ? <(.*) \/>/
23。匹配首尾空格的正則表達式:(^\s*) ?(\s*$)
正則幾個基本概念:
正則幾個基本概念:view plaincopy to clipboardprint?
1.貪婪:+,*,?,{m,n}等默認是貪婪匹配,即儘可能多匹配,也叫最大匹配
如果後面加上?,就轉化爲非貪婪匹配,需要高版本支持
1.貪婪:+,*,?,{m,n}等默認是貪婪匹配,即儘可能多匹配,也叫最大匹配
如果後面加上?,就轉化爲非貪婪匹配,需要高版本支持view plaincopy to clipboardprint?
2.獲取:默認用(x ¦y)是獲取匹配,很多時候只是測試,不一定要求得到所匹配的數據,尤其在嵌套匹配或大數據中就要用非獲取匹配(?:x ¦y),這樣提高了效率,優化了程序。
2.獲取:默認用(x ¦y)是獲取匹配,很多時候只是測試,不一定要求得到所匹配的數據,尤其在嵌套匹配或大數據中就要用非獲取匹配(?:x ¦y),這樣提高了效率,優化了程序。view plaincopy to clipboardprint?
3.消耗:默認是消耗匹配,一般在預查中是非消耗匹配。
舉個例子,2003-2-8要變爲2003-02-08
如果用/-(\d)-/第二次匹配將從8開始,從而只替換第一個2,錯誤
如果用/-(\d)(?=-)/則第二次匹配從第二個-開始,即不消耗字符-
3.消耗:默認是消耗匹配,一般在預查中是非消耗匹配。
舉個例子,2003-2-8要變爲2003-02-08
如果用/-(\d)-/第二次匹配將從8開始,從而只替換第一個2,錯誤
如果用/-(\d)(?=-)/則第二次匹配從第二個-開始,即不消耗字符-view plaincopy to clipboardprint?
4.預查:js中分爲正向預查和負向預查
如上面的(?=pattern)是正向預查,在任何匹配 pattern 的字符串開始處匹配查找字符串。還有 (?!pattern)是負向預查,在任何不匹配 pattern 的字符串開始處匹配查找字符串。負向預查有時會用在對[^]的擴充,[^]只是一些字符,而?!可以使整個字符串。
4.預查:js中分爲正向預查和負向預查
如上面的(?=pattern)是正向預查,在任何匹配 pattern 的字符串開始處匹配查找字符串。還有 (?!pattern)是負向預查,在任何不匹配 pattern 的字符串開始處匹配查找字符串。負向預查有時會用在對[^]的擴充,[^]只是一些字符,而?!可以使整個字符串。view plaincopy to clipboardprint?
5.回調:一般用在替換上,即根據不用的匹配內容返回不用的替換值,從而簡化了程序,需要高版本支持
5.回調:一般用在替換上,即根據不用的匹配內容返回不用的替換值,從而簡化了程序,需要高版本支持view plaincopy to clipboardprint?
6.引用:\num 對所獲取的第num個匹配的引用。
例如,’(.)\1\1′ 匹配AAA型。’(.)(.)\2\1′ 匹配ABBA型。
6.引用:\num 對所獲取的第num個匹配的引用。
例如,’(.)\1\1′ 匹配AAA型。’(.)(.)\2\1′ 匹配ABBA型。view plaincopy to clipboardprint?
正則表達式保留字
^ (carat)
. (period)
[ (left bracket}
$ (dollar sign)
( (left parenthesis)
) (right parenthesis)
? (pipe)
* (asterisk)
+ (plus symbol)
? (question mark)
{ (left curly bracket, or left brace)
\ backslash
正則表達式保留字
^ (carat)
. (period)
[ (left bracket}
$ (dollar sign)
( (left parenthesis)
) (right parenthesis)
? (pipe)
* (asterisk)
+ (plus symbol)
? (question mark)
{ (left curly bracket, or left brace)
\ backslash view plaincopy to clipboardprint?
構造 匹配於
構造 匹配於 view plaincopy to clipboardprint?
字符
x 字符 x
\\ 反斜線字符
\0n 八進制值的字符0n (0 <= n <= 7)
\0nn 八進制值的字符 0nn (0 <= n <= 7)
\0mnn 八進制值的字符0mnn 0mnn (0 <= m <= 3, 0 <= n <= 7)
\xhh 十六進制值的字符0xhh
\uhhhh 十六進制值的字符0xhhhh
\t 製表符('\u0009')
\n 換行符 ('\u000A')
\r 回車符 ('\u000D')
\f 換頁符 ('\u000C')
\a 響鈴符 ('\u0007')
\e 轉義符 ('\u001B')
\cx T對應於x的控制字符 x
字符
x 字符 x
\\ 反斜線字符
\0n 八進制值的字符0n (0 <= n <= 7)
\0nn 八進制值的字符 0nn (0 <= n <= 7)
\0mnn 八進制值的字符0mnn 0mnn (0 <= m <= 3, 0 <= n <= 7)
\xhh 十六進制值的字符0xhh
\uhhhh 十六進制值的字符0xhhhh
\t 製表符('\u0009')
\n 換行符 ('\u000A')
\r 回車符 ('\u000D')
\f 換頁符 ('\u000C')
\a 響鈴符 ('\u0007')
\e 轉義符 ('\u001B')
\cx T對應於x的控制字符 x view plaincopy to clipboardprint?
字符類
[abc] a, b, or c (簡單類)
[^abc] 除了a、b或c之外的任意 字符(求反)
[a-zA-Z] a到z或A到Z ,包含(範圍)
[a-z-[bc]] a到z,除了b和c : [ad-z](減去)
[a-z-[m-p]] a到z,除了m到 p: [a-lq-z]
[a-z-[^def]] d, e, 或 f
字符類
[abc] a, b, or c (簡單類)
[^abc] 除了a、b或c之外的任意 字符(求反)
[a-zA-Z] a到z或A到Z ,包含(範圍)
[a-z-[bc]] a到z,除了b和c : [ad-z](減去)
[a-z-[m-p]] a到z,除了m到 p: [a-lq-z]
[a-z-[^def]] d, e, 或 f view plaincopy to clipboardprint?
預定義的字符類
. 任意字符(也許能與行終止符匹配,也許不能)
\d 數字: [0-9]
\D 非數字: [^0-9]
\s 空格符: [ \t\n\x0B\f\r]
\S 非空格符: [^\s]
\w 單詞字符: [a-zA-Z_0-9]
\W 非單詞字符: [^\w]