編輯距離

編輯距離

 

編輯距離,又稱Levenshtein距離(也叫做Edit Distance),是指兩個字串之間,由一個轉成另一個所需的最少編輯操作次數。許可的編輯操作包括將一個字符替換成另一個字符,插入一個字符,刪除一個字符。
例如將kitten一字轉成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的編輯距離是3。俄羅斯科學家Vladimir Levenshtein在1965年提出這個概念。
給出兩個字符串a,b,求a和b的編輯距離。
Input第1行:字符串a(a的長度 <= 1000)。 第2行:字符串b(b的長度 <= 1000)。 Output輸出a和b的編輯距離 Sample Input
kitten
sitting
Sample Output
3

【分析】dp[i]j[j] 代表 1~i位的字符串1轉變爲1~j位的字符串2所需的最少次數

#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
#define cl(a,b) memset(a,b,sizeof a);
const int maxn = 1e3 + 10;
char a[maxn],b[maxn];
int dp[maxn][maxn];
int main()
{
    while(~scanf("%s%s",&a,&b)){
        int lena = strlen(a),lenb = strlen(b);
        cl(dp,0);
        for(int i=0;i<=lena;i++){
            dp[i][0] = i;
        }
        for(int i=0;i<=lenb;i++){
            dp[0][i] = i;
        }
        for(int i=1;i<=lena;i++){
            for(int j=1;j<=lenb;j++){
                if(a[i-1] == b[j-1]){
                    dp[i][j] = dp[i-1][j-1];
                }
                else{
                    dp[i][j] = min(dp[i-1][j]+1,dp[i][j-1]+1);
                    dp[i][j] = min(dp[i][j],dp[i-1][j-1]+1);
                }
            }
        }
        printf("%d\n",dp[lena][lenb]);
    }
    return 0;
}


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章