正則表達式,爬蟲地時候用的比較多吧,暫時還沒有接觸過寫爬蟲地代碼,先放下
寫好正則表達式也是個不容易的事啊
1.什麼是正則表達式的貪婪與非貪婪匹配
如:String str="abcaxc";
Patter p="ab.*c";
貪婪匹配:正則表達式一般趨向於最大長度匹配,也就是所謂的貪婪匹配。如上面使用模式p匹配字符串str,結果就是匹配到:abcaxc(ab.*c)。
非貪婪匹配:就是匹配到結果就好,最少的匹配字符。如上面使用模式p匹配字符串str,結果就是匹配到:abc(ab.*?c)。
2、編程中如何區分兩種模式
默認是貪婪模式;在量詞後面直接加上一個問號?就是非貪婪模式。
下面的都是量詞:
{m,n}:m到n個
*:任意多個
+:一個到多個
?:0或一個
貪婪匹配:在滿足匹配時,匹配儘可能長的字符串,默認情況下,採用貪婪匹配
example = "abbbbbbc"
pattern = re.compile("ab+")
貪婪模式:正則表達式一般趨向於最大長度匹配,也就是所謂的貪婪匹配。如上面使用模式pattern 匹配字符串example,匹配到的結果就是”abbbbbb”整個字符串。
非貪婪模式:在整個表達式匹配成功的前提下,儘可能少的匹配。如上面使用模式pattern 匹配字符串example,匹配到的結果就只是”ab”整個字符串。
這個還是比較好理解的