正则表达式的贪婪模式有感

1. 总述

贪婪模式感觉就像,只要符合我当前的规则就一直匹配,才不会去管正则表达式中我后面的限制规则

2. 例子

 static final Pattern CONTENT_PATTERN1 = Pattern.compile("_\\S*?==");
 static final Pattern CONTENT_PATTERN2 = Pattern.compile("_\\S*==");
    @Test
    public void splitContent1() {
        String content = "_123==_456==";
        List<String> contentList = new ArrayList<>();
        Matcher matcher = CONTENT_PATTERN2.matcher(content);
        while (matcher.find()) {
            contentList.add(matcher.group());
        }
        System.out.println(contentList);
    }

3. 分析

  • 当使用CONTENT_PATTERN1和CONTENT_PATTERN2,进行正则匹配,得到的结果与预期完全不同(contentList的元素个数不同)。
  • 区别就在于Pattern的一个‘?’, 进行非贪婪模式匹配。当使用’\S’,因为是Java所以写成’\\S’, 匹配任何非空白字符,‘*’,匹配0次或多次。
  • 根据总结,贪婪模式下,尽管正则表达式后面有’==‘加以限制,但内容中’==‘部分仍属于’\\S’的配配规则,所以会继续匹配下去。

4. 总结

当我们使用‘\S’, ‘.’, 类似这种字符进行匹配文本,且使用’*‘或者’+'这种多次匹配规则时,一定要考虑是否要加入非贪婪模式限定符。

如果觉得文章对你有用,右侧边栏点个打赏吧!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章