一、基础说明
public String replaceAll(String regex, String replacement)
使用replacement
替换字符串中和regex
匹配的所有子串,
regex
为正则表达式,源码:
/**
* @since 1.4
* @spec JSR-51
*/
public String replaceAll(String regex, String replacement) {
return Pattern.compile(regex).matcher(this).replaceAll(replacement);
}
请注意区分
public String replace(CharSequence target, CharSequence replacement)
public String replace(CharSequence target, CharSequence replacement)
源码
/**
* 使用replacement替换字符串中所有和target匹配的子串
* 从字符串开始到结尾依次替换
* 例如:“aaa”.replace("aa","b"),结果为“ba”,而不是“ab”
*
* @since 1.5
*/
public String replace(CharSequence target, CharSequence replacement) {
return Pattern.compile(target.toString(), Pattern.LITERAL).matcher(this).replaceAll(Matcher.quoteReplacement(replacement.toString()));
}
从源码可以看出,两者都是使用的Matcher.replaceAll(String replacement)
二、捕获组用法
replaceAll的一般用法就不介绍了,直接说捕获组用法,示例代码
String phone = "18310005432";
phone = phone.replaceAll("(\\d{3})\\d+(\\d{4})", "$1****$2");
System.out.println(phone);// 183****5432
捕获组是正则表达式中的概念,如上例中(\\d{3})\\d+(\\d{4})
,一个括号()为一个捕获组,捕获组按左括号先后顺序编号,(\\d{3})
为1号,(\\d{4})
为2号,整个正则表达式为0号捕获组,可以使用$
加编号(索引)对捕获组进行引用
- jdk 中文API
- 英文原版
上文示例代码理解,(\\d{3})\\d+(\\d{4})
匹配整个字符串,其中捕获组1(\\d{3})
匹配到183
,捕获组2(\\d{4})
匹配到5432
,$1****$2
中$1
是对1组匹配值的引用,$2
同理
三、命名捕获组
我们可以给捕获组起名字,方便引用,适用于包含大量捕获组的正则表达式
- 命名方式:
(?<NAME>A)
,捕获组A被命名为NAME,例:(?<n1>\\d{3})
,名字仅允许[A-Za-z0-9] - 引用
\k<Name>
正则表达式内部引用前面定义过的捕获组,k大概是back的意思backref(回引),例:(?<char>.{1})\\k<char>*
;${Name}
在Matcher’s replacement 字符串中引用命名捕获组;group(String NAME)
Matcher的group方法,返回命名捕获组匹配到的子串;
- 用例
String phone = "18310005432";
System.out.println(phone.replaceAll("(?<n1>\\d{3})\\d+(?<n2>\\d{4})", "${n1}****${n2}"));
System.out.println(phone.replaceAll("(?<n1>\\d{3})\\d+(?<n2>\\d{4})", "${n1}****$2"));
System.out.println(phone.replaceAll("(?<n1>\\d{3})\\d+(?<n2>\\d{4})", "${n2}****$2"));
- 复杂用例
String input = "aabbbccdddef";
String regex = "(?<char>.{1})\\k<char>*";
//Matcher用法
Pattern pattern = Pattern.compile(regex);
Matcher matcher=pattern.matcher(input);
while(matcher.find()) {
System.out.println(matcher.group()+":"+matcher.group(0)+":"+matcher.group(1)+":"+matcher.group("char"));
}
//replaceAll
String temp = input.replaceAll(regex, "$0,");
String[] arr = temp.split(",");
System.out.println(java.util.Arrays.toString(arr));
(?<char>.{1})\\k<char>*
理解 (?<char>.{1})
匹配一个字符,\\k<char>*
零个或多个该字符
group()内部调用的group(0)
group(1)和group(“char”)都是指向第一个捕获组