正则表达式是繁杂,总是记不住,今天特地做一个正则表达式的总结,方便记忆
- 锚定:^和$,分别用来匹配字符串的开始和结束
例如:“^abc$”:就是要求以abc开头和以abc结尾的字符串,实际上是只有abc匹配;
- 重复:‘*’ ‘+’ 和 ‘?’,分别用来表示一个字符可以出现的次数或者顺序 ,他们分别表示为
“zero or more”相当于{0,},“ab*”:和ab{0,}同义,匹配以a开头,后面可以接0个或者N个b组成的字符串(”a”, “ab”, “abbb”, 等);
“one or more”相当于{1,},“ab+”:和ab{1,}同义,同上条一样,但最少要有一个b存在 (”ab” “abbb”等);
“zero or one.”相当于{0,1},“ab?”:和ab{0,1}同义,可以没有或者只有一个b;
“a?b+$”:匹配以一个或者0个a再加上一个以上的b结尾的字符串。
- 范围:{最少出现次数,最多出现次数}
例如:“ab{3,5}”: 要求a后面可以有2-5个b(”abbb”, “abbbb”, or “abbbbb”)。
- 分块:()合并一个整体去匹配,并放入内存中
例如:“a(bc)*”: 匹配 a 后面跟0个或者一个”bc”;
- 逻辑:字符 ‘|’,相当于OR操作
例如:“(a|b)*c”: 匹配含有这样多个(包括0个)a或b,后面跟一个c的字符串;
- 一个点:'.'可以代表所有的单一字符,不包括”\n”
例如:“a.[0-9]”: 一个a加一个字符再加一个0到9的数字;如果,要匹配包括”\n”在内的所有单个字符,怎么办?用’[\n.]’这种模式。
- 中括号:中括号括住的内容只匹配一个单一的字符
例如:“[a-d]”: 匹配’a’ 到’d’的单个字符 (和”a│b│c│d” 还有 “[abcd]”效果一样);
- 以\开头的
\b 出现在目标字符串的开头或结尾的两个边界之一,边界可以是空格或者特殊字符;比如’ve\b’,可以匹配love里的ve而不匹配very里有ve。
\B 对象必须位于目标字符串的开头和结尾两个边界之内,即匹配对象既不能作为目标字符串的开头,也不能作为目标字符串的结尾;
\s: 用于匹配单个空格符,包括tab键和换行符,等价于[\f\t\v];
\S: 用于匹配除单个空格符之外的任何一个字符,[^\f\t\v];
\w: 用于匹配一个字母、数字或下划线字符,等价于[0-9a-zA-Z_];
\W: 用于匹配所有除英文字母、数字和下划线以外任何的一个字符,[^0-9a-zA-Z_];
- 指定某一个范围而不局限于具体的字符