正则表达式中的贪婪模式和非贪婪模式

正则表达式

我们知道正则表达式中:

  • 点号(.) —> 匹配除换行符之外的任意单个字符
  • 星号(*) —> 匹配0个或多个之前的字符(比如:a*可以匹配0个或多个a)
  • 问号(?) —> 匹配0个或1个之前的字符(比如:a?可以匹配0个或1个a)
  • 点号和星号组合(.*) —> 匹配除换行符之外的所有字符(贪婪模式)
  • 点号、星号和问号组合(.*?) —> 匹配符合条件的最少字符(也即非贪婪模式)

 
这里分享一个网站regex101,可以方便的查看和测试正则表达式。
 

贪婪模式

贪婪模式
上图中,正则表达式为(.*)(\d+).*,测试文本为"Flink_123.java"。

可以在右下角看到匹配结果:

  • 分组1中,(.*)匹配了尽可能多的字符。
  • 分组2中,虽然(\d+)可以匹配多个数字,但是因为分组1是贪婪模式,所以(\d+)只匹配了最后一个数字。
     

非贪婪模式

非贪婪模式
上图中,正则表达式为(.*?)(\d+).*,测试文本为"Flink_123.java"。

可以在右下角看到匹配结果:

  • 分组1中,(.*?)匹配了尽可能少的符合条件的字符。
  • 分组2中,(\d+)就匹配了所有数字
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章