JAVA正则表达式捕获组的使用

从学java开始就没弄清楚过捕获组的用法,一般没有处理复杂字符串的时候也不会去用。之前一直理解错了捕获组的用法,一直以为捕获组是可以循环捕获的
我以为的写法是这样的 (组1(组2))* 即组1循环匹配字符串,其实压根不是这样。
正确的做法是 捕获组表达式只要匹配最小的一个单元即可 然后通过 循环调用find去一步步推进匹配
这里很详细
这里是我自己的编写正则时候的工具网络,不是很稳定,可以是git自己搭过个
贴一个将xml文本里面的字段存入map的正则表达式使用例子 这里的xml并没有多级结构,也没有多余的属性

 Pattern p=Pattern.compile("<(?<node>[0-9A-Za-z_]{2,50}?)>(?<val>.*?)<[/](?:[0-9A-Z_a-z]{2,50})>");
        Matcher matcher = p.matcher(xml);
        while (matcher.find()) {
            String key = matcher.group("node");
            String val = matcher.group("val");
            result.put(key.trim(), val.trim());
        }

(?: 代表非捕获组 即也是组 但find时候忽略
(? 即对 此捕获组取名 为 node
?) 即非贪心的 最小匹配 如果正则没有详细匹配往大了写 如.* 那么最好加上

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章