KMP
KMP算法又稱“看毛片”算法,是一種效率非常高的字符串匹配算法。
kmp算法完成的任務是:給定兩個字符串O和f,長度分別爲n和m,判斷f是否在O中出現,如果出現則返回出現的位置。常規方法是遍歷a的每一個位置,然後從該位置開始和b進行匹配,但是這種方法的複雜度是O(nm)。kmp算法通過一個O(m)的預處理,使匹配的複雜度降爲O(n+m)。
思想:我們首先用一個圖來描述kmp算法的思想。在字符串O中尋找f,當匹配到位置i時兩個字符串不相等,這時我們需要將字符串f向前移動。常規方法是每次向前移動一位,但是它沒有考慮前i-1位已經比較過這個事實,所以效率不高。事實上,如果我們提前計算某些信息,就有可能一次前移多位。假設我們根據已經獲得的信息知道可以前移k位,我們分析移位前後的f有什麼特點。我們可以得到如下的結論:
• A段字符串是f的一個前綴。
• B段字符串是f的一個後綴。
• A段字符串和B段字符串相等。
所以前移k位之後,可以繼續比較位置i的前提是f的前i-1個位置滿足:長度爲i-k-1的前綴A和後綴B相同。只有這樣,我們纔可以前移k位後從新的位置繼續比較。
所以kmp算法的核心即是計算字符串f每一個位置之前的字符串的前綴和後綴公共部分的最大長度(不包括字符串本身,否則最大長度始終是字符串本身)。獲得f每一個位置的最大公共長度之後,就可以利用該最大公共長度快速和字符串O比較。當每次比較到兩個字符串的字符不同時,我們就可以根據最大公共長度將字符串f向前移動(已匹配長度-最大公共長度)位,接着繼續比較下一個位置。事實上,字符串f的前移只是概念上的前移,只要我們在比較的時候從最大公共長度之後比較f和O即可達到字符串f前移的目的。
以hdu1711爲例
模版題直接貼代碼
#include <cstdio>
using namespace std;
const int maxm=1e4+5,maxn=1e6+5;
int n,m,sn[maxn],sm[maxm],next[maxm];
void set_next()
{
next[0]=next[1]=0;
for(int i=1;i<m;i++)
{
int tmp=next[i];
while(tmp && sm[i]!=sm[tmp]) tmp = next[tmp];
if(sm[i]==sm[tmp]) tmp++;
next[i+1]=tmp;
}
}
int main()
{
int t,num;
bool flag;
scanf("%d",&t);
while(t--)
{
scanf("%d%d",&n,&m);
for(int i=0;i<n;i++) scanf("%d",&sn[i]);
for(int i=0;i<m;i++) scanf("%d",&sm[i]);
set_next();
flag=false;
num=0;
for(int i=0;i<n;i++)
{
while(num && sn[i]!=sm[num]) num=next[num];
if(sn[i]==sm[num]) num++;
if(num==m)
{
flag=true;
printf("%d\n",i-m+2);
break;
}
}
if(!flag) printf("-1\n");
}
return 0;
}