正則
一、概念
正則:就是對字符串操作的一種邏輯公式。其實就是用提前事先定義好的一些特殊的代表字符來組成規律性的字符串, 來對字符串進行一些查找替換的操作。
二、創建正則
- 字面量創建方式: var reg = /規則字符串/修飾符;
var reg = /web/ig;
console.log(reg);///web/gi
- 構造函數創建方式: var reg = new RegExp(‘規則字符串’, ‘修飾符’);
var reg1 = new RegExp('web', 'ig');
console.log(reg1);///web/gi
三、 修飾符
-
i: ignore case 忽略大小寫情況
-
g: global 全局匹配
var str = 'web123WEB456web789web000';
var reg = /web/gi;
var s = str.replace(reg, 'python');
console.log(s);//python123python456python789python000
四、字符串方法
- 替換:字符串.replace(正則, 新字符); 返回新字符串, 原字符串不改變
var str = 'web123WEB456web789web000';
var reg = /web/gi;
var s = str.replace(reg, 'python');
console.log(s);//python123python456python789python000
- 分隔:字符串.split(正則); 返回新數組
var str = 'web123Web456web789web000';
var reg = /web/gi;
var arr = str.split(reg);
console.log(arr)//(5) ["", "123", "456", "789", "000"]
- 挑選:字符串.match(正則); 挑選符合條件的字符,組成新的數組後返回回來
var str = 'web123Web456web789web000';
var reg = /\d/ig; // 匹配數字
var arr2 = str.match(reg);
console.log(arr2);//(12) ["1", "2", "3", "4", "5", "6", "7", "8", "9", "0", "0", "0"]
- 查找:字符串.search(正則); 從下標爲0的位置開始匹配,匹配到符合正則的字符後就返回下標
var str = 'web123Web456web789web000';
var reg = /\d/ig; // 匹配數字
console.log(str.search(reg));//3
五、檢索方法(exec、test)
-
exec: 正則.exec(要匹配的字符串); 每次會返回符合條件的字符組成的數組
-
test: 正則.test(要匹配符的字符串); 返回是否匹配成功, 匹配成功返回true, 失敗返回false
*如果不加修飾符g,每次都是從0開始查找或者匹配, 如果加了g, 表示從上一次匹配到的位置的下一位開始匹配, 匹配結果返回null或者false之後,下一次匹配從0 開始重新匹配
*reg.lastIndex 獲取到當前開始匹配正則的位置
var str = 'web123web456';
var reg = /\d\d\d/g;
console.log(reg.lastIndex); // 0
console.log(reg.exec(str)); // ["1", index: 3, input: "web123web456", groups: undefined]
console.log(reg.lastIndex); // 4
console.log(reg.exec(str)); // 2
console.log(reg.lastIndex); // 5
console.log(reg.exec(str)); // 3
console.log(reg.lastIndex); // 0
console.log(reg.test(str)); // true
console.log(reg.lastIndex); // 6
console.log(reg.test(str)); // true
console.log(reg.lastIndex); // 12
console.log(reg.test(str)); // false
console.log(reg.lastIndex); // 0
console.log(reg.test(str)); // true
六、 元字符
- 點. : 匹配除換行以外的所有字符
var str = '\n 123';
var reg = /./;
console.log(reg.exec(str));//[" ", index: 1, input: "↵ 123", groups: undefined]
- []: 字符集, 要匹配的字符的字符集合, 在字符集中不需要加,分隔,也不需要加引號 [^]: 字符集, 不要匹配的字符的字符集合
var str = 'web123web456';
var reg = /[413]/ig;
console.log(reg.exec(str)); // 1
console.log(reg.exec(str)); // 3
- \d: 匹配數字 在字符集中 0-9==\d \D:匹配非數字
var str = 'web123';
var reg = /\d\d\d/ig;
console.log(reg.exec(str)); // 123
var reg = /\D/ig;
console.log(reg.exec(str)); // w
// 銀行卡密碼 6位數字
var reg = /\d\d\d\d\d\d/;
var str = 'a12345';
console.log(reg.test(str));//false
- \s: 匹配空格 \S: 匹配非空格
var str = 'web 123';
var reg = /\s/ig;
console.log(reg.exec(str)); // 3
var reg = /\S/ig;
console.log(reg.exec(str)); // 0
- \w: 匹配數字、字母、_ \W: 匹配非數字、字母、_
var str = '_w1.23*';
var reg = /\w/ig;
console.log(reg.exec(str)); // _
var reg = /\W/ig;
console.log(reg.exec(str)); // .
- \b: 匹配單詞邊界 \B: 匹配非單詞邊界
var str = 'you are a beautiful boy';
var reg = /\ba/ig; // 匹配a左邊是邊界的a
console.log(reg.exec(str)); // 4
var reg = /a\B/ig; // 匹配a右邊不是單詞邊界
console.log(reg.exec(str)); // 4
- ^: 以什麼爲開頭 $: 以什麼爲結尾
var str = '912345';
var reg = /^\d\d\d\d\d\d$/;
console.log(reg.test(str)); //true
console.log(reg.exec(str)); //["912345", index: 0, input: "912345", groups: undefined]
七、多個字符
- a?: 表示一個或0個
var str = '1web123';
var reg = /\d?/ig;
console.log(reg.exec(str));//["1", index: 0, input: "1web123", groups: undefined]
- a*: 表示匹配0個或者連續的多個字符,儘可能多的去匹配
var str = '123456web33333';
var reg = /\d*/;
console.log(reg.exec(str));//["123456", index: 0, input: "123456web33333", groups: undefined]
- a+: 表示匹配至少一個以上的連續的字符,儘可能多的去匹配
var str = 'webweb3444';
var reg = /\d+/;
console.log(reg.exec(str));//["3444", index: 6, input: "webweb3444", groups: undefined]
- a{n,m}: 表示至少匹配n次,最多匹配m次
- a{n}: 表示只匹配n次
var str = 'web1234567890';
var reg = /\d{3}/;
console.log(reg.exec(str)); // 123
- a{n,}: 至少匹配n次
var str = 'web1234567890';
var reg = /\d{3,}/;
console.log(reg.exec(str)); // 1234567890
- a{n,m}: 表示至少匹配n次,最多匹配m次
var str = 'web1234567890';
var reg = /^web\d{3,6}/;
console.log(reg.exec(str)); // web123456
八、其它字符
-
|: 或
-
(): 分組 獲取分組的匹配值: RegExp.$1 RegExp.$2
var str = 'web1zweb2web3';
var reg = /web(1|5)(w|z)/;
console.log(reg.exec(str)); // ["web1z", "1", "z", index: 0, input: "web1zweb2web3", groups: undefined]
console.log(RegExp.$1);//1
console.log(RegExp.$2);//z
- (?:): 非獲取匹配
var str = 'web1zweb2web3';
var reg = /web(?:5|2)/; // web後面是5或者是2的web
console.log(reg.exec(str));//["web2", index: 5, input: "web1zweb2web3", groups: undefined]
- (?=): 正向肯定預查
var str = 'web123webdffff';
var reg = /web(?=\d+)/; // web後面必須跟數字
console.log(reg.exec(str));//["web", index: 0, input: "web123webdffff", groups: undefined]
- (?!): 正向否定預查
var reg = /web(?!\d+)/; // web後面不跟數字的
console.log(reg.exec(str));//["web", index: 6, input: "web123webdffff", groups: undefined]
- (?<=): 反向肯定預查
var reg = /(?<=\d+)web/; // web的前面是跟數字的web
console.log(reg.exec(str)); // 6
- (?<!): 反向否定預查
var reg = /(?<!\d+)web/;
console.log(reg.exec(str)); // 0
// 不能全是數字的組合
var str = '124456';
var reg = /(?!^\d+$)^[0-9a-zA-Z]+$/;
console.log(reg.test(str)); // false
// 必須是數字和字母的組合 不能全是數字、不能全是字母
var reg = /(?!^\d+$)(?!^[a-zA-Z]+$)^[0-9a-zA-Z]+$/;
var str = '1223a3344';
console.log(reg.test(str)); // false
常用正則
一、校驗數字的表達式
-
數字:^[0-9]*$
-
n位的數字:^\d{n}$
-
至少n位的數字:^\d{n,}$
-
m-n位的數字:^\d{m,n}$
-
零和非零開頭的數字:^(0|[1-9][0-9]*)$
-
非零開頭的最多帶兩位小數的數字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
-
帶1-2位小數的正數或負數:^(-)?\d+(.\d{1,2})?$
-
正數、負數、和小數:^(-|+)?\d+(.\d+)?$
-
有兩位小數的正實數:^[0-9]+(.[0-9]{2})?$
-
有1~3位小數的正實數:^[0-9]+(.[0-9]{1,3})?$
-
非零的正整數:^[1-9]\d*$ 或 ^([1-9][0-9]){1,3}$ 或 ^+?[1-9][0-9]$
-
非零的負整數:^-[1-9][]0-9"$ 或 ^-[1-9]\d$
-
非負整數:^\d+$ 或 ^[1-9]\d*|0$
-
非正整數:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
-
非負浮點數:^\d+(.\d+)?$ 或 ^[1-9]\d*.\d*|0.\d*[1-9]\d*|0?.0+|0$
-
非正浮點數:^((-\d+(.\d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]\d*.\d*|0.\d*[1-9]\d*))|0?.0+|0$
-
正浮點數:^[1-9]\d*.\d*|0.\d*[1-9]\d*$ 或 ^(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9]))$
-
負浮點數:^-([1-9]\d*.\d*|0.\d*[1-9]\d*)$ 或 ^(-(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9])))$
-
浮點數:^(-?\d+)(.\d+)?$ 或 ^-?([1-9]\d*.\d*|0.\d*[1-9]\d*|0?.0+|0)$
二、校驗字符的表達式
-
漢字:^[\u4e00-\u9fa5]{0,}$
-
英文和數字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
-
長度爲3-20的所有字符:^.{3,20}$
-
由26個英文字母組成的字符串:^[A-Za-z]+$
-
由26個大寫英文字母組成的字符串:^[A-Z]+$
-
由26個小寫英文字母組成的字符串:^[a-z]+$
-
由數字和26個英文字母組成的字符串:^[A-Za-z0-9]+$
-
由數字、26個英文字母或者下劃線組成的字符串:^\w+$ 或 ^\w{3,20}$
-
中文、英文、數字包括下劃線:^[\u4E00-\u9FA5A-Za-z0-9_]+$
-
中文、英文、數字但不包括下劃線等符號:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
-
可以輸入含有^%&’,;=?KaTeX parse error: Can't use function '\"' in math mode at position 1: \̲"̲等字符:[^%&',;=?\x22]+ 12 禁止輸入含有~的字符:[^~\x22]+
三、特殊需求表達式
-
Email地址:^\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*$
-
域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
-
InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+.)+[\w-]+(/[\w-./?%&=]*)?$
-
手機號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
-
電話號碼(“XXX-XXXXXXX”、“XXXX-XXXXXXXX”、“XXX-XXXXXXX”、“XXX-XXXXXXXX”、"XXXXXXX"和"XXXXXXXX):^((\d{3,4}-)|\d{3.4}-)?\d{7,8}$
-
國內電話號碼(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
-
身份證號(15位、18位數字):^\d{15}|\d{18}$
-
短身份證號碼(數字、字母x結尾):^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
-
帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
-
密碼(以字母開頭,長度在6~18之間,只能包含字母、數字和下劃線):^[a-zA-Z]\w{5,17}$
-
強密碼(必須包含大小寫字母和數字的組合,不能使用特殊字符,長度在8-10之間):^(?=.\d)(?=.[a-z])(?=.*[A-Z]).{8,10}$
-
日期格式:^\d{4}-\d{1,2}-\d{1,2}
-
一年的12個月(01~09和1~12):^(0?[1-9]|1[0-2])$
-
一個月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
-
錢的輸入格式:
-
1.有四種錢的表示形式我們可以接受:“10000.00” 和 “10,000.00”, 和沒有 “分” 的 “10000” 和 “10,000”:^[1-9][0-9]*$
-
2.這表示任意一個不以0開頭的數字,但是,這也意味着一個字符"0"不通過,所以我們採用下面的形式:^(0|[1-9][0-9]*)$
-
3.一個0或者一個不以0開頭的數字.我們還可以允許開頭有一個負號:^(0|-?[1-9][0-9]*)$
-
4.這表示一個0或者一個可能爲負的開頭不爲0的數字.讓用戶以0開頭好了.把負號的也去掉,因爲錢總不能是負的吧.下面我們要加的是說明可能的小數部分:^[0-9]+(.[0-9]+)?$
-
5.必須說明的是,小數點後面至少應該有1位數,所以"10."是不通過的,但是 “10” 和 “10.2” 是通過的:^[0-9]+(.[0-9]{2})?$
-
6.這樣我們規定小數點後面必須有兩位,如果你認爲太苛刻了,可以這樣:^[0-9]+(.[0-9]{1,2})?$
-
7.這樣就允許用戶只寫一位小數.下面我們該考慮數字中的逗號了,我們可以這樣:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
-
8.1到3個數字,後面跟着任意個 逗號+3個數字,逗號成爲可選,而不是必須:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
-
備註:這就是最終結果了,別忘了"+“可以用”*"替代如果你覺得空字符串也可以接受的話(奇怪,爲什麼?)最後,別忘了在用函數時去掉去掉那個反斜槓,一般的錯誤都在這裏
-
xml文件:^([a-zA-Z]±?)+[a-zA-Z0-9]+\.[x|X][m|M][l|L]$
-
中文字符的正則表達式:[\u4e00-\u9fa5]
-
雙字節字符:[^\x00-\xff] (包括漢字在內,可以用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1))
-
空白行的正則表達式:\n\s*\r (可以用來刪除空白行)
-
HTML標記的正則表達式:<(\S*?)[^>]>.?</\1>|<.*? /> (網上流傳的版本太糟糕,上面這個也僅僅能部分,對於複雜的嵌套標記依舊無能爲力)
-
首尾空白字符的正則表達式:^\s*|\s*KaTeX parse error: Undefined control sequence: \s at position 4: 或(^\̲s̲*)|(\s*) (可以用來刪除行首行尾的空白字符(包括空格、製表符、換頁符等等),非常有用的表達式)
-
騰訊QQ號:[1-9][0-9]{4,} (騰訊QQ號從10000開始)
-
中國郵政編碼:[1-9]\d{5}(?!\d) (中國郵政編碼爲6位數字)
-
IP地址:\d+.\d+.\d+.\d+ (提取IP地址時有用)
-
IP地址:((? : (?:25[0-5]|2[0-4]\d|[01]?\d?\d)\.){3}(?:25[0-5]|2[0-4]\d|[01]?\d?\d))