flag的取值範圍如下:
Pattern.CANON_EQ :當且僅當兩個字符的"正規分解(canonical decomposition)"都完全相同的情況下,才認定匹配。比如用了這個標誌之後,表達式"a\u030A"會匹配"?"。默認情況下,不考慮"規範相等性(canonical equivalence)"。
Pattern.CASE_INSENSITIVE(?i): 默認情況下,大小寫不明感的匹配只適用於US-ASCII字符集。這個標誌能讓表達式忽略大小寫進行匹配。要想對Unicode字符進行大小不明感的匹配,只要將UNICODE_CASE與這個標誌合起來就行了。
Pattern.COMMENTS(?x):在這種模式下,匹配時會忽略(正則表達式裏的)空格字符(譯者注:不是指表達式裏的"\\s",而是指表達式裏的空格,tab,回車之類)。註釋從#開始,一直到這行結束。可以通過嵌入式的標誌來啓用Unix行模式。
Pattern.DOTALL(?s) :在這種模式下,表達式'.'可以匹配任意字符,包括表示一行的結束符。默認情況下,表達式'.'不匹配行的結束符。
Pattern.MULTILINE(?m):在這種模式下,'^'和'$'分別匹配一行的開始和結束。此外,'^'仍然匹配字符串的開始,'$'也匹配字符串的結束。默認情況下,這兩個表達式僅僅匹配字符串的開始和結束。
Pattern.UNICODE_CASE(?u):在這個模式下,如果你還啓用了CASE_INSENSITIVE標誌,那麼它會對Unicode字符進行大小寫不明感的匹配。默認情況下,大小寫不敏感的匹配只適用於US-ASCII字符集。
Pattern.UNIX_LINES(?d):在這個模式下,只有'\n'才被認作一行的中止,並且與'.','^',以及'$'進行匹配。
拋開空泛的概念,下面寫出幾個簡單的Java正則用例:
◆比如,在字符串包含驗證時
//查找以Java開頭,任意結尾的字符串 Pattern pattern = Pattern.compile("^Java.*"); Matcher matcher = pattern.matcher("Java不是人"); boolean b= matcher.matches(); //當條件滿足時,將返回true,否則返回false System.out.println(b); |
◆以多條件分割字符串時
Pattern pattern = Pattern.compile("[, |]+"); String[] strs = pattern.split("Java Hello World Java,Hello,,World|Sun"); for (int i=0;iSystem.out.println(strs[i]); } |
◆文字替換(首次出現字符)
Pattern pattern = Pattern.compile("正則表達式"); Matcher matcher = pattern.matcher("正則表達式 Hello World,正則表達式 Hello World"); //替換第一個符合正則的數據 System.out.println(matcher.replaceFirst("Java")); |
◆文字替換(全部)
Pattern pattern = Pattern.compile("正則表達式"); Matcher matcher = pattern.matcher("正則表達式 Hello World,正則表達式 Hello World"); //替換第一個符合正則的數據 System.out.println(matcher.replaceAll("Java")); |
◆文字替換(置換字符)
Pattern pattern = Pattern.compile("正則表達式"); Matcher matcher = pattern.matcher("正則表達式 Hello World,正則表達式 Hello World "); StringBuffer sbr = new StringBuffer(); while (matcher.find()) { matcher.appendReplacement(sbr, "Java"); } matcher.appendTail(sbr); System.out.println(sbr.toString()); |