Java String.ReplaceAll捕获组用法(正则表达式捕获组及命名捕获组)

一、基础说明

public String replaceAll(String regex, String replacement) 使用replacement替换字符串中和regex匹配的所有子串,
regex正则表达式,源码:

  /** 
   * @since 1.4
   * @spec JSR-51
   */
    public String replaceAll(String regex, String replacement) {
        return Pattern.compile(regex).matcher(this).replaceAll(replacement);
    }

请注意区分
public String replace(CharSequence target, CharSequence replacement)

public String replace(CharSequence target, CharSequence replacement)源码

  /**
    * 使用replacement替换字符串中所有和target匹配的子串
    * 从字符串开始到结尾依次替换
    * 例如:“aaa”.replace("aa","b"),结果为“ba”,而不是“ab”
    *
    * @since 1.5
    */
   public String replace(CharSequence target, CharSequence replacement) {
       return Pattern.compile(target.toString(), Pattern.LITERAL).matcher(this).replaceAll(Matcher.quoteReplacement(replacement.toString()));
   }

从源码可以看出,两者都是使用的Matcher.replaceAll(String replacement)

二、捕获组用法

replaceAll的一般用法就不介绍了,直接说捕获组用法,示例代码

String phone = "18310005432";
phone = phone.replaceAll("(\\d{3})\\d+(\\d{4})", "$1****$2");
System.out.println(phone);// 183****5432

捕获组是正则表达式中的概念,如上例中(\\d{3})\\d+(\\d{4}),一个括号()为一个捕获组,捕获组按左括号先后顺序编号,(\\d{3}) 为1号,(\\d{4})为2号,整个正则表达式为0号捕获组,可以使用$加编号(索引)对捕获组进行引用

  • jdk 中文API在这里插入图片描述
  • 英文原版
    在这里插入图片描述
    上文示例代码理解,(\\d{3})\\d+(\\d{4}) 匹配整个字符串,其中捕获组1(\\d{3})匹配到183,捕获组2(\\d{4})匹配到5432,$1****$2$1 是对1组匹配值的引用,$2同理

三、命名捕获组

我们可以给捕获组起名字,方便引用,适用于包含大量捕获组的正则表达式

  • 命名方式:
    (?<NAME>A),捕获组A被命名为NAME,例:(?<n1>\\d{3}),名字仅允许[A-Za-z0-9]
  • 引用
    • \k<Name> 正则表达式内部引用前面定义过的捕获组,k大概是back的意思backref(回引),例:(?<char>.{1})\\k<char>*;
    • ${Name}在Matcher’s replacement 字符串中引用命名捕获组;
    • group(String NAME)Matcher的group方法,返回命名捕获组匹配到的子串;
  • 用例
String phone = "18310005432";
System.out.println(phone.replaceAll("(?<n1>\\d{3})\\d+(?<n2>\\d{4})", "${n1}****${n2}"));
System.out.println(phone.replaceAll("(?<n1>\\d{3})\\d+(?<n2>\\d{4})", "${n1}****$2"));
System.out.println(phone.replaceAll("(?<n1>\\d{3})\\d+(?<n2>\\d{4})", "${n2}****$2"));
  • 复杂用例
String input = "aabbbccdddef";
String regex = "(?<char>.{1})\\k<char>*";
//Matcher用法
Pattern pattern = Pattern.compile(regex);
Matcher matcher=pattern.matcher(input);
while(matcher.find()) {
   System.out.println(matcher.group()+":"+matcher.group(0)+":"+matcher.group(1)+":"+matcher.group("char"));
}
//replaceAll
String temp = input.replaceAll(regex, "$0,");
String[] arr = temp.split(",");
System.out.println(java.util.Arrays.toString(arr));

(?<char>.{1})\\k<char>* 理解 (?<char>.{1})匹配一个字符,\\k<char>*零个或多个该字符
group()内部调用的group(0)
group(1)和group(“char”)都是指向第一个捕获组

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章