KMP算法
詳解找來找去感覺還是這兩篇解釋的很好
KMP算法(1):如何理解KMP
KMP算法(2):其細微之處
筆記
next[i]=j,即模式串p[1-i]的最長的相同真前後綴的長度
#include "stdafx.h"
#include "string"
#include "iostream"
using namespace std;
void getNext(string p, int next[])
{
int len = p.size();
int i = 0;
int j = -1;
next[0] = -1;
while (i < len - 1)
{
if (j == -1 || p[i] == p[j])
next[++i] = ++j;
else
j = next[j];
}
}
int KMP(string s, string p, int next[])
{
int i, j;
int pl = p.size();
int sl = s.size();
for (i = 0, j = 0; i < sl&& j < pl;)//注意這裏不要用j<p.size() 因爲p.size()是unsigned int 類型,然後j有可能變成-1然後直接跳出循環
{
if (j == -1 || s[i] == p[j])
{
i++;
j++;
}
else
j = next[j];
}
if (j == p.size())
return i - j;
return -1;
}
int main()
{
int next[100] = { 0 };
string s = "abababababcdab";
string p = "abcdab";
cout << "主串:" << s << endl;
cout << "子串:" << p << endl;
getNext(p, next);
cout << "next數組爲:";
for (int i = 0; i < p.size(); i++)
cout << next[i];
cout << endl;
cout << "匹配位置:" << KMP(s, p, next) << endl;
return 0;
}
結果
手工求解next數組方法
以下兩種方法互通,分別爲以0爲初始或以-1爲初始
1.以0爲初始
i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|---|
p | a | b | a | b | a | a | a | b | a | b | a |
next | 0 | 1 |
- 當i=0,1 next[0],next[1]分別初始爲0,1
- 當i=2,p的前2位爲
ab
,因next[1]=1
,則觀察ab
的前1
位和後1
位是否相同,不同,所以next[2]=1
(記住後面運算時若連1位相同都沒有則記爲1
,即最小記爲1,其實看後面就知道意思是next[i]=0+1=1
) - 當i=3,p的前3位爲
aba
,因next[2]=1
,則觀察aba
的前1
位和後1
位是否相同,相同,則在原基礎上+1
,即next[3]=1+1=2
- 當i=4,p的前4位爲
abab
,因next[3]=2
,則觀察abab
的前2
位和後2
位是否相同,相同,則在原基礎上+1
,即next[4]=2+1=3
- 當i=5,p的前5位爲
ababa
,因next[4]=3
,則觀察ababa
的前3
位和後3
位是否相同,相同,則在原基礎上+1
,即next[5]=3+1=4
- 當i=6,p的前6位爲
ababaa
,因next[5]=4
,則觀察ababaa
的前4
位和後4
位是否相同,不相同,則在原基礎上-1
,觀察前3
位和後3
位是否相同,不同繼續-1
,直到觀察到前2
位和後2
位相同,若不同再繼續減,後觀察到前1位和後1位相同,則next[6]=1+1=2 - 當i=7,p的前7位爲
ababaaa
,因next[5]=2
,則觀察ababaaa
的前2
位和後2
位是否相同,不相同,則在原基礎上-1
,觀察前1
位和後1
位是否相同,相同,則next[7]=1+1=2 - …
- …
- …
最終爲
i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|---|
p | a | b | a | b | a | a | a | b | a | b | a |
next | 0 | 1 | 1 | 2 | 3 | 4 | 2 | 2 | 3 | 4 | 5 |
2.以-1爲初始
i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|---|
p | a | b | a | b | a | a | a | b | a | b | a |
next | -1 | 0 |
- 當i=0,1 next[0],next[1]分別初始爲-1,0
- 當i=2,p的前2位爲
ab
,因next[1]=0
,則next[1]+1=1
,觀察前1
位和後1
位是否相同,不同,則1-1=0
,到0爲止,則next[2]=0
(1-1=0
中第一個1的意思即前1位和後1位是否相同中的1) - 當i=3,p的前3位爲
aba
,因next[2]=0
,則next[2]+1=1
,則觀察的前1
位和後1
位是否相同,相同,則next[3]=1
- 當i=4,p的前4位爲
abab
,因next[3]=1
,則next[3]+1=2
,則觀察前2
位和後2
位是否相同,相同,則next[4]=2
- 當i=5,p的前5位爲
ababa
,因next[4]=2
,則next[4]+1=3
,則觀察前3
位和後3
位是否相同,相同,則next[4]=3
- 當i=6,p的前6位爲
ababaa
,因next[5]=3
,則next[5]+1=4
,則觀察前4
位和後4
位是否相同,不相同;則觀察前3
位和後3
位是否相同,不同;則觀察前2
位和後2
位是否相同,不相同;則觀察前1
位和後1
位是否相同,相同,則next[6]=1
- 當i=7,p的前6位爲
ababaaa
,因next[6]=1
,則next[6]+1=2
,則觀察前2
位和後2
位是否相同,不相同;則觀察前1
位和後1
位是否相同,相同,則next[7]=1
- …
- …
- …
最終爲
i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|---|
p | a | b | a | b | a | a | a | b | a | b | a |
next | -1 | 0 | 0 | 1 | 2 | 3 | 1 | 1 | 2 | 3 | 4 |
倆種方法的關係
觀察發現法1的next數組每項+1就是法2的next數組,所以考試時無論用哪一種都是可以的,只要分析或者看清
是以什麼爲初值就行
其實還可以理解爲把法1的next數組向右移1位,並把首位賦值位-1