正则表达式

正则表达式是繁杂,总是记不住,今天特地做一个正则表达式的总结,方便记忆

  • 锚定:^和$,分别用来匹配字符串的开始和结束

 例如:“^abc$”:就是要求以abc开头和以abc结尾的字符串,实际上是只有abc匹配;

  • 重复:‘*’ ‘+’ 和 ‘?’,分别用来表示一个字符可以出现的次数或者顺序 ,他们分别表示为

“zero or more”相当于{0,},“ab*”:和ab{0,}同义,匹配以a开头,后面可以接0个或者N个b组成的字符串(”a”, “ab”, “abbb”, 等);

“one or more”相当于{1,},“ab+”:和ab{1,}同义,同上条一样,但最少要有一个b存在 (”ab” “abbb”等);

“zero or one.”相当于{0,1},“ab?”:和ab{0,1}同义,可以没有或者只有一个b;

“a?b+$”:匹配以一个或者0个a再加上一个以上的b结尾的字符串。

要点:’*’ ‘+’ 和 ‘?’ 只管它前面那个字符。

  •  范围:{最少出现次数,最多出现次数}

例如:“ab{3,5}”: 要求a后面可以有2-5个b(”abbb”, “abbbb”, or “abbbbb”)。

  • 分块:()合并一个整体去匹配,并放入内存中

例如:“a(bc)*”: 匹配 a 后面跟0个或者一个”bc”;

  • 逻辑:字符 ‘|’,相当于OR操作

例如:“(a|b)*c”: 匹配含有这样多个(包括0个)a或b,后面跟一个c的字符串;

  • 一个点:'.'可以代表所有的单一字符,不包括”\n”

例如:“a.[0-9]”: 一个a加一个字符再加一个0到9的数字;如果,要匹配包括”\n”在内的所有单个字符,怎么办?用’[\n.]’这种模式。

  • 中括号:中括号括住的内容只匹配一个单一的字符

例如:“[a-d]”: 匹配’a’ 到’d’的单个字符 (和”a│b│c│d” 还有 “[abcd]”效果一样);

  • 以\开头的

\b     出现在目标字符串的开头或结尾的两个边界之一,边界可以是空格或者特殊字符;比如’ve\b’,可以匹配love里的ve而不匹配very里有ve。

\B     对象必须位于目标字符串的开头和结尾两个边界之内,即匹配对象既不能作为目标字符串的开头,也不能作为目标字符串的结尾;

\s:   用于匹配单个空格符,包括tab键和换行符,等价于[\f\t\v];

\S:   用于匹配除单个空格符之外的任何一个字符,[^\f\t\v];

\d:   匹配从0到9的一个数字,等价于[0-9];

\D     匹配除数字以外任何一个字符,等价于[^0-9];

\w:   用于匹配一个字母、数字或下划线字符,等价于[0-9a-zA-Z_];

\W:   用于匹配所有除英文字母、数字和下划线以外任何的一个字符,[^0-9a-zA-Z_];

\A     匹配字符串串首的原子

\Z     匹配字符串串尾的原子

\f     匹配一个换页符等价于 \x0c 或 \cL

匹配一个换行符;等价于 \x0a 或 \cJ

匹配一个回车符等价于\x0d 或 \cM

\t     匹配一个制表符;等价于 \x09\或\cl

\v     匹配一个垂直制表符;等价于\x0b或\ck

\oNN   匹配一个八进制数字

\xNN   匹配一个十六进制数字

\cC    匹配一个控制字符

  • 指定某一个范围而不局限于具体的字符

/[A-Z]/

上述正则表达式将会与从A到Z范围内任何一个大写字母相匹配。

/[a-z]/

上述正则表达式将会与从a到z范围内任何一个小写字母相匹配。

/[0-9]/

上述正则表达式将会与从0到9范围内任何一个数字相匹配。

/([a-z][A-Z][0-9])+/

 

 

 

 

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章