KMP-hdu1711

KMP

KMP算法又稱“看毛片”算法,是一種效率非常高的字符串匹配算法。

kmp算法完成的任務是:給定兩個字符串O和f,長度分別爲n和m,判斷f是否在O中出現,如果出現則返回出現的位置。常規方法是遍歷a的每一個位置,然後從該位置開始和b進行匹配,但是這種方法的複雜度是O(nm)。kmp算法通過一個O(m)的預處理,使匹配的複雜度降爲O(n+m)。

思想:我們首先用一個圖來描述kmp算法的思想。在字符串O中尋找f,當匹配到位置i時兩個字符串不相等,這時我們需要將字符串f向前移動。常規方法是每次向前移動一位,但是它沒有考慮前i-1位已經比較過這個事實,所以效率不高。事實上,如果我們提前計算某些信息,就有可能一次前移多位。假設我們根據已經獲得的信息知道可以前移k位,我們分析移位前後的f有什麼特點。我們可以得到如下的結論:
• A段字符串是f的一個前綴。
• B段字符串是f的一個後綴。
• A段字符串和B段字符串相等。
所以前移k位之後,可以繼續比較位置i的前提是f的前i-1個位置滿足:長度爲i-k-1的前綴A和後綴B相同。只有這樣,我們纔可以前移k位後從新的位置繼續比較。

所以kmp算法的核心即是計算字符串f每一個位置之前的字符串的前綴和後綴公共部分的最大長度(不包括字符串本身,否則最大長度始終是字符串本身)。獲得f每一個位置的最大公共長度之後,就可以利用該最大公共長度快速和字符串O比較。當每次比較到兩個字符串的字符不同時,我們就可以根據最大公共長度將字符串f向前移動(已匹配長度-最大公共長度)位,接着繼續比較下一個位置。事實上,字符串f的前移只是概念上的前移,只要我們在比較的時候從最大公共長度之後比較f和O即可達到字符串f前移的目的。

以hdu1711爲例
模版題直接貼代碼

#include <cstdio>
using namespace std;

const int maxm=1e4+5,maxn=1e6+5;
int n,m,sn[maxn],sm[maxm],next[maxm];

void set_next()
{
    next[0]=next[1]=0;
    for(int i=1;i<m;i++)
    {
        int tmp=next[i];
        while(tmp && sm[i]!=sm[tmp]) tmp = next[tmp];
        if(sm[i]==sm[tmp]) tmp++;
        next[i+1]=tmp;
    }
}

int main()
{
    int t,num;
    bool flag;
    scanf("%d",&t);
    while(t--)
    {
        scanf("%d%d",&n,&m);
        for(int i=0;i<n;i++) scanf("%d",&sn[i]);
        for(int i=0;i<m;i++) scanf("%d",&sm[i]);
        set_next();
        flag=false;
        num=0;
        for(int i=0;i<n;i++)
        {
            while(num && sn[i]!=sm[num]) num=next[num];
            if(sn[i]==sm[num]) num++;
            if(num==m)
            {
                flag=true;
                printf("%d\n",i-m+2);
                break;
            }
        }
        if(!flag) printf("-1\n");
    }
    return 0;
}
發佈了82 篇原創文章 · 獲贊 37 · 訪問量 11萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章