正则表达式笔记

正则表达式笔记

几个例子

例1:
下面的正则表达式匹配的就是位於单引号或双引号之内的所有字符.但是,它要求开始和结束的引号匹配(例如两个都是双引号或者都是单引号):
/[' "] [^ ' "]*[' "]/

如果要求开始和结束的引号匹配,我们可以使用如下的引用:

/( [' "] ) [^ ' "] * \1/

\1匹配的是第一个代括号的子表达式所匹配的模式.在这个例子中,它实施了一种规约,那就是开始的引号必须和结束的引号相匹配.
注意,如果反斜杠后跟随的数字比代括号的子表达式数多,那么它就会被解析为一个十进制的转义序列,而不是一个引用。

分组号是从左到右计数的左括号数

例2:
如果我们想检索 “java” 这个词自身 (不像在 “javascript” 中那样作为前缀),那么我们可以使用模式 /\s java \s /,
它要求在词语java之前和之后都有空格.但是这样有两个问题.
第一: 如果 “java” 出现在一个字符的开头或者是结尾.该模式就不会与之匹配,除非在开头和结尾处有一个空格.
第二: 当这个模式找到一个与之匹配的字符时,它返回的匹配的字符串前端和后端都有空格,这并不是我们想要的.
因此,我们使用词语的边界 \b 来代替真正的空格符 \s 进行匹配. 结果表达式是 /\b java \b/.
^ 匹配的是字符的开头,在多行检索中,匹配的是一行的开头
$ 匹配的是字符的结尾,在多行检索中,匹配的是一行的结尾
\b 匹配的是一个词语的边界.简而言之就是位于字符\w 和 \w之间的位置(注意:[\b]匹配的是退格符)
\B 匹配的是非词语的边界的字符

容易忽略但需要时特别好用

字符[xyz]
意义:一字符列表,匹配列出中的任一字符。你可以通过连字符-指出一个字符范围。
例如:[abcd]跟[a-c]一样。它们匹配”brisket”中的’b’和”ache”中的’c’。

字符[^xyz]
意义:一字符补集,也就是说,它匹配除了列出的字符外的所有东西。 你可以使用连字符-指出一 字符范围。
例如:[^abc]和[^a-c]等价,它们最早匹配”brisket”中的’r’和”chop.”中的’h’。

字符[\b]
意义:匹配一个空格(不要与\b混淆)

字符\b
意义:匹配一个单词的分界线,比如一个空格(不要与[\b]混淆)
例如:/\bn\w/匹配”noonday”中的’no’,/\wy\b/匹配”possibly yesterday.”中的’ly’。

字符\B
意义:匹配一个单词的非分界线
例如:/\w\Bn/匹配”noonday”中的’on’,/y\B\w/匹配”possibly yesterday.”中的’ye’。

(?:x) 匹配 x 不会捕获匹配项。这被称为非捕获括号(non-capturing parentheses)。匹配项不能够从结果数组的元素 [1], …, [n] 或已被定义的 RegExp 对象的属性 1,..., 9 再次访问到。

x(?=y) 只有当 x 后面紧跟着 y 时,才匹配 x。 例如,/Jack(?=Sprat)/ 只有在 ‘Jack’ 后面紧跟着 ‘Sprat’ 时,才会匹配它。/Jack(?=Sprat|Frost)/ 只有在 ‘Jack’ 后面紧跟着 ‘Sprat’ 或 ‘Frost’ 时,才会匹配它。然而,’Sprat’ 或 ‘Frost’ 都不是匹配结果的一部分。

x(?!y)
只有当 x 后面不是紧跟着 y 时,才匹配 x。例如,/\d+(?!.)/ 只有当一个数字后面没有紧跟着一个小数点时,才会匹配该数字。
/\d+(?!.)/.exec(“3.141”) 匹配 141 而不是 3.141。

js原生正则方法

创建正则对象方法

/pattern/flags

new RegExp(pattern [, flags])

RegExp(pattern [, flags])

注意:文本格式中的参数不要使用引号标记,而构造器函数的参数则要使用引号标记。所以下面的表达式建立同样的正则表达式:
/ab+c/i
new RegExp(“ab+c”, “i”)

当使用构造函数的时候,必须使用正常的字符串避开规则(在字符串中加入前导字符\ )是必须的。
例如,下面的两条语句是等价的:
re = new RegExp(“\\w+”)
re = /\w+/

正则对象方法:

exec() 方法在一个指定字符串中执行一个搜索匹配。返回一个结果数组或 null。

如果你只是为了判断是否匹配(true或 false),可以使用 RegExp.test() 方法,或者 String.search() 方法。

var result = regExp.exec(‘The Quick Brown Fox Jumps Over The Lazy Dog’);

result 为一个数组,幷包含index、input属性:
[0] 匹配的全部字符串
[1], …[n ] 括号中的分组捕获
index 匹配到的字符位于原始字符串的基于0的索引值
input 原始字符串

原生js String方法:
str.match(regexp);
返回一个包含了整个匹配结果以及任何括号捕获的匹配结果的 Array ;如果没有匹配项,则返回 null 。

如果正则表达式没有 g 标志,则 str.match() 会返回和 RegExp.exec() 相同的结果。

如果正则表达式包含 g 标志,则该方法返回一个 Array ,它包含所有匹配的子字符串而不是匹配对象。捕获组不会被返回(即不返回index属性和input属性)。如果没有匹配到,则返回 null

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章