【每日算法Day 92】經典面試題:編輯距離

題目鏈接

LeetCode 72. 編輯距離[1]

題目描述

給你兩個單詞 word1word2,請你計算出將 word1 轉換成 word2 所使用的最少操作數 。

你可以對一個單詞進行如下三種操作:

  • 插入一個字符
  • 刪除一個字符
  • 替換一個字符

示例1

        輸入:
word1 = "horse", word2 = "ros"
輸出:
3
解釋:
horse -> rorse (將 'h' 替換爲 'r')
rorse -> rose (刪除 'r')
rose -> ros (刪除 'e')
      

示例2

        輸入:
word1 = "intention", word2 = "execution"
輸出:
5
解釋:
intention -> inention (刪除 't')
inention -> enention (將 'i' 替換爲 'e')
enention -> exention (將 'n' 替換爲 'x')
exention -> exection (將 'n' 替換爲 'c')
exection -> execution (插入 'u')
      

題解

這是一道典型的動態規劃題目,我們用 dp[i][j] 表示 word1_{1:i} 轉換成 word2_{1:j} 所需要的最小步數。那麼對於最後一個字符來說,有如下四種情況:

  • 如果 word1_{i} = word2_{j} ,那麼最後一個字符不需要操作,答案就是 dp[i-1][j-1]
  • 如果 最後一步操作是插入得到的,那麼問題就轉化爲了 word1_{1:i} 轉換成 word2_{1:j-1} 所需要的最小步數。最後再插入 word2_{j} 就行了,答案就是 dp[i][j-1] + 1
  • 如果 最後一步操作是刪除得到的,那麼問題就轉化爲了 word1_{1:i-1} 轉換成 word2_{1:j} 所需要的最小步數。最後再刪除 word1_{i} 就行了,答案就是 dp[i-1][j] + 1
  • 如果 最後一步操作是替換得到的,那麼問題就轉化爲了 word1_{1:i-1} 轉換成 word2_{1:j-1} 所需要的最小步數。最後再將 word1_{i} 替換爲 word2_{j} 就行了,答案就是 dp[i-1][j-1] + 1

綜上,如果 word1_{i} = word2_{j} ,那麼 dp[i][j] = dp[i-1][j-1] 。否則的話:

dp[i][j] = \min{\{dp[i][j-1], dp[i-1][j], dp[i-1][j-1]\}} + 1 \\

初始化就是,所有的 dp[0][i] = i ,因爲需要插入 i 次。所有的 dp[i][0] = i ,因爲需要刪除 i 次。

總的時間複雜度就是 O(nm)

代碼

c++

        class Solution {
public:
    int minDistance(string word1, string word2) {
        int n = word1.size(), m = word2.size();
        vector<vector<int> > dp(n+1, vector<int>(m+1, INT_MAX));
        dp[0][0] = 0;
        for (int i = 0; i < m; ++i) dp[0][i+1] = i + 1;
        for (int i = 0; i < n; ++i) dp[i+1][0] = i + 1;
        for (int i = 0; i < n; ++i) {
            for (int j = 0; j < m; ++j) {
                if (word1[i] == word2[j]) {
                    dp[i+1][j+1] = dp[i][j];
                    continue;
                }
                // 插入
                dp[i+1][j+1] = min(dp[i+1][j+1], dp[i+1][j]+1);
                // 刪除
                dp[i+1][j+1] = min(dp[i+1][j+1], dp[i][j+1]+1);
                // 替換
                dp[i+1][j+1] = min(dp[i+1][j+1], dp[i][j]+1);
            }
        }
        return dp[n][m];
    }
};

      

python

        class Solution:
    def minDistance(self, word1: str, word2: str) -> int:
        n, m = len(word1), len(word2)
        dp = [[0]*(m+1) for _ in range(n+1)]
        dp[0] = [i for i in range(m+1)]
        for i in range(n+1): dp[i][0] = i
        for i in range(n):
            for j in range(m):
                if word1[i] == word2[j]:
                    dp[i+1][j+1] = dp[i][j]
                    continue
                dp[i+1][j+1] = min(dp[i+1][j], dp[i][j+1], dp[i][j]) + 1
        return dp[n][m]

      
關注【算法碼上來】,每日算法乾貨馬上就來!

參考資料

[1]

LeetCode 72. 編輯距離: leetcode-cn.com/problem

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章