正则表达式
我们知道正则表达式中:
- 点号(.) —> 匹配除换行符之外的任意单个字符
- 星号(*) —> 匹配0个或多个之前的字符(比如:a*可以匹配0个或多个a)
- 问号(?) —> 匹配0个或1个之前的字符(比如:a?可以匹配0个或1个a)
- 点号和星号组合(.*) —> 匹配除换行符之外的所有字符(贪婪模式)
- 点号、星号和问号组合(.*?) —> 匹配符合条件的最少字符(也即非贪婪模式)
这里分享一个网站regex101,可以方便的查看和测试正则表达式。
贪婪模式
上图中,正则表达式为(.*)(\d+).*,测试文本为"Flink_123.java"。
可以在右下角看到匹配结果:
- 分组1中,(.*)匹配了尽可能多的字符。
- 分组2中,虽然(\d+)可以匹配多个数字,但是因为分组1是贪婪模式,所以(\d+)只匹配了最后一个数字。
非贪婪模式
上图中,正则表达式为(.*?)(\d+).*,测试文本为"Flink_123.java"。
可以在右下角看到匹配结果:
- 分组1中,(.*?)匹配了尽可能少的符合条件的字符。
- 分组2中,(\d+)就匹配了所有数字