Java正則表達式入門(2)

flag的取值範圍如下:

Pattern.CANON_EQ :當且僅當兩個字符的"正規分解(canonical decomposition)"都完全相同的情況下,才認定匹配。比如用了這個標誌之後,表達式"a\u030A"會匹配"?"。默認情況下,不考慮"規範相等性(canonical equivalence)"。

Pattern.CASE_INSENSITIVE(?i): 默認情況下,大小寫不明感的匹配只適用於US-ASCII字符集。這個標誌能讓表達式忽略大小寫進行匹配。要想對Unicode字符進行大小不明感的匹配,只要將UNICODE_CASE與這個標誌合起來就行了。

Pattern.COMMENTS(?x):在這種模式下,匹配時會忽略(正則表達式裏的)空格字符(譯者注:不是指表達式裏的"\\s",而是指表達式裏的空格,tab,回車之類)。註釋從#開始,一直到這行結束。可以通過嵌入式的標誌來啓用Unix行模式。

Pattern.DOTALL(?s) :在這種模式下,表達式'.'可以匹配任意字符,包括表示一行的結束符。默認情況下,表達式'.'不匹配行的結束符。

Pattern.MULTILINE(?m):在這種模式下,'^'和'$'分別匹配一行的開始和結束。此外,'^'仍然匹配字符串的開始,'$'也匹配字符串的結束。默認情況下,這兩個表達式僅僅匹配字符串的開始和結束。

Pattern.UNICODE_CASE(?u):在這個模式下,如果你還啓用了CASE_INSENSITIVE標誌,那麼它會對Unicode字符進行大小寫不明感的匹配。默認情況下,大小寫不敏感的匹配只適用於US-ASCII字符集。

Pattern.UNIX_LINES(?d):在這個模式下,只有'\n'才被認作一行的中止,並且與'.','^',以及'$'進行匹配。

拋開空泛的概念,下面寫出幾個簡單的Java正則用例:

◆比如,在字符串包含驗證時

//查找以Java開頭,任意結尾的字符串
Pattern pattern = Pattern.compile("^Java.*");
Matcher matcher = pattern.matcher("Java不是人");
boolean b= matcher.matches();
//當條件滿足時,將返回true,否則返回false
System.out.println(b);

◆以多條件分割字符串時

Pattern pattern = Pattern.compile("[, |]+");
String[] strs = pattern.split("Java Hello World  Java,Hello,,World|Sun");
for (int i=0;iSystem.out.println(strs[i]);
} 

◆文字替換(首次出現字符)

Pattern pattern = Pattern.compile("正則表達式");
Matcher matcher = pattern.matcher("正則表達式 Hello World,正則表達式 Hello World");
//替換第一個符合正則的數據
System.out.println(matcher.replaceFirst("Java"));

◆文字替換(全部)

Pattern pattern = Pattern.compile("正則表達式");
Matcher matcher = pattern.matcher("正則表達式 Hello World,正則表達式 Hello World");
//替換第一個符合正則的數據
System.out.println(matcher.replaceAll("Java"));

◆文字替換(置換字符)

Pattern pattern = Pattern.compile("正則表達式");
Matcher matcher = pattern.matcher("正則表達式 Hello World,正則表達式 Hello World ");
StringBuffer sbr = new StringBuffer();
while (matcher.find()) {
matcher.appendReplacement(sbr, "Java");
}
matcher.appendTail(sbr);
System.out.println(sbr.toString());



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章