[LeetCode](面試題19)正則表達式匹配

題目

請實現一個函數用來匹配包含'. ''*'的正則表達式。模式中的字符'.'表示任意一個字符,而'*'表示它前面的字符可以出現任意次(含0次)。在本題中,匹配是指字符串的所有字符匹配整個模式。例如,字符串"aaa"與模式"a.a""ab*ac*a"匹配,但與"aa.a""ab*a"均不匹配。

示例 1:

輸入:
s = "aa"
p = "a"
輸出: false
解釋: "a" 無法匹配 "aa" 整個字符串。

示例 2:

輸入:
s = "aa"
p = "a*"
輸出: true
解釋: 因爲 '*' 代表可以匹配零個或多個前面的那一個元素, 在這裏前面的元素就是 'a'。因此,字符串 "aa" 可被視爲 'a' 重複了一次。

示例 3:

輸入:
s = "ab"
p = ".*"
輸出: true
解釋: ".*" 表示可匹配零個或多個('*')任意字符('.')。

示例 4:

輸入:
s = "aab"
p = "c*a*b"
輸出: true
解釋: 因爲 '*' 表示零個或多個,這裏 'c' 爲 0 個, 'a' 被重複一次。因此可以匹配字符串 "aab"。

示例 5:

輸入:
s = "mississippi"
p = "mis*is*p*."
輸出: false
  • s 可能爲空,且只包含從 a-z 的小寫字母。
  • p 可能爲空,且只包含從 a-z 的小寫字母以及字符 .*,無連續的 '*'

解題思路

解法一:動態規劃

我們每次從模式串 p 中取出一個字符或者“字符 + 星號”的組合,並在字符串 s 中進行匹配。對於 p 中一個字符而言,它只能在 s 中匹配一個字符,匹配的方法具有唯一性;而對於 p 中“字符 + 星號”的組合而言,它可以在 s 中匹配任意自然數個字符,並不具有唯一性。因此我們可以考慮使用動態規劃,對匹配的方案進行枚舉。
用 dp[i][j] 表示 s 的前 i 個字符與 p 中的前 j 個字符是否能夠匹配。在進行狀態轉移時,我們考慮 p 的第 j 個字符的匹配情況:

  1. 初始化:
    1.1)動態規劃的邊界條件爲 dp[0][0] =true,即空串和空正則是可以匹配的。
    1.2)非空串和空正則必不匹配,dp[1][0]=…=dp[n][0]=false。
  2. 如果 p[j] == s[i] :dp[i][j] = dp[i-1][j-1];
  3. 如果 p[j] == ‘.’ :dp[i][j] = dp[i-1][j-1];
  4. 如果 p[j] == ‘*’,分兩種情況:
    4.1)如果 p[j-1] == s[i] || p[j-1] == ‘.’ :
    4.1.1)dp[i][j] = dp[i-1][j] // 匹配 s 末尾的一個字符,將該字符從 s 中丟掉,p 還可以繼續進行匹配;
    4.1.2)or dp[i][j] = dp[i][j-2] // “字符 + 星號”的組合沒用,直接丟掉,不再進行匹配。
    4.2)如果 p[j-1] != ‘.’ && p[j-1] != s[i] :dp[i][j] = dp[i][j-2] // p 中 * 前面的字符在 s 中出現0次,p直接前移2格。
  5. 返回結果:最終的答案即爲 dp[m][n]。

複雜度分析:
時間複雜度:O(mn),其中 m 和 n 分別是字符串 s 和 p 的長度。我們需要計算出所有的狀態,並且每個狀態在進行轉移時的時間複雜度爲 O(1)。
空間複雜度:O(mn),即爲存儲所有狀態使用的空間。

解法二:遞歸

  1. 如果是兩個普通字符串進行匹配,按序遍歷比較即可:if( s.charAt(i) == p.charAt(i) )
  2. 同樣的,如果正則表達式字符串p只有一種"."一種特殊標記,依然是按序遍歷比較即可 :if( s.charAt(i) == p.charAt(i) || p.charAt(i) == ‘.’ )
  3. 當出現 ‘*’ 這個特殊字符時需要特殊處理,當p的第i個元素的下一個元素是 ‘*’ 時會有兩種情況:
    3.1)i元素需要出現0次,我們就保持s不變,將p減掉兩個元素,調用 isMatch。例如s:bc、p:a*bc,我們就保持s不變,減掉p的"\a*",調用 isMatch(s:bc,p:bc)。
    3.2)i元素需要出現一次或更多次,先比較i元素和s的首元素,相等則保持p不變,s減掉首元素,調用 isMatch。例如s:aabb、p:a*bb,就保持p不變,減掉s的首元素,調用 isMatch(s:abb,p:a*bb)。

此時可能存在兩種結果,例如s:abb、p:a*abb,會用兩種方式處理:
1)按照上述 3.1 情況減去p的兩個元素,調用 isMatch(s:abb,p:abb),最終導致true。
2)按照上述 3.2 情況比較i元素和s的首元素時,發現相等就會減掉s的首字符,調用 isMatch(s:bb,p:a*abb)。再按照上述 3.1 情況減去p的兩個元素,調用 isMatch(s:bb,p:abb),最終導致false。

所以當遇到情況 3 出現 ‘*’ 時,要將所有的情況走一遍,看看是否存在可以匹配的情形。

代碼

解法一:動態規劃

class Solution {
    public boolean isMatch(String s, String p) {
        int m = s.length();
        int n = p.length();
        boolean[][] dp = new boolean[m+1][n+1]; // java中初始化全爲false
        // 空字符串和空正則串可以匹配,非空字符串和空正則串不匹配。
        dp[0][0] = true;
        for(int i=0; i<=m; i++){
            for(int j=1; j<=n; j++){
                // 非空正則分爲兩種情況:非* 和 *,注意字符串的索引比字符串的長度小1。
                if(p.charAt(j-1) != '*'){
                    if(i >= 1 && (p.charAt(j-1) == '.' || p.charAt(j-1) == s.charAt(i-1))){
                        dp[i][j] = dp[i-1][j-1];
                    }
                }else{
                    if(i >= 1 && (p.charAt(j-2) == s.charAt(i-1) || p.charAt(j-2) == '.')){
                        dp[i][j] = dp[i-1][j] || dp[i][j-2];
                    }else{
                        dp[i][j] = dp[i][j-2];
                    }
                }
            }
        }
        return dp[m][n];
    }
}

解法二:遞歸

class Solution {
    public boolean isMatch(String s, String p) {
        if(s.length() == 0 && p.length() == 0){
            return true;
        }
        if(s.length() != 0 && p.length() == 0){
            return false;
        }
        // 如果p的第i個元素的下一個元素是 ‘*’ 時
        if(p.length() >= 2 && p.charAt(1) == '*'){
            // i元素需要出現0次,我們就保持s不變,將p減掉兩個元素;
            // 或者i元素需要出現一次或更多次,先比較i元素和s的首元素,相等則保持p不變,s減掉首元素
            return isMatch(s, p.substring(2)) || ((!s.isEmpty() && (s.charAt(0) == p.charAt(0) || p.charAt(0) == '.')) && isMatch(s.substring(1), p));
        }else{
            return ((!s.isEmpty() && (s.charAt(0) == p.charAt(0) || p.charAt(0) == '.')) && isMatch(s.substring(1), p.substring(1)));
        }

    }
}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章