[數據結構筆記]KMP算法及手工求解next數組

原創

senjay

2020-06-21 07:57

KMP算法

詳解找來找去感覺還是這兩篇解釋的很好
KMP算法（1）：如何理解KMP
KMP算法（2）：其細微之處

筆記

next[i]=j,即模式串p[1-i]的最長的相同真前後綴的長度

#include "stdafx.h"
#include "string"
#include "iostream"
using namespace std;
void getNext(string p, int next[])
{
	int len = p.size();
	int i = 0;
	int j = -1;
	next[0] = -1;
	while (i < len - 1)
	{
		if (j == -1 || p[i] == p[j])
			next[++i] = ++j;
		else
			j = next[j];
	}
}
int KMP(string s, string p, int next[])
{
	int i, j;
	int pl = p.size();
	int sl = s.size();
	for (i = 0, j = 0; i < sl&& j < pl;)//注意這裏不要用j<p.size() 因爲p.size()是unsigned int 類型，然後j有可能變成-1然後直接跳出循環
	{
		if (j == -1 || s[i] == p[j])
		{
			i++;
			j++;
		}
		else
			j = next[j];
	}
	if (j == p.size())
		return i - j;
	return -1;
}

int main()
{
	int next[100] = { 0 };
	string s = "abababababcdab";
	string p = "abcdab";
	cout << "主串:" << s << endl;
	cout << "子串:" << p << endl;

	getNext(p, next);
	cout << "next數組爲：";
	for (int i = 0; i < p.size(); i++)
		cout << next[i];
	cout << endl;

	cout << "匹配位置:" << KMP(s, p, next) << endl;
	return 0;
}

結果

手工求解next數組方法

以下兩種方法互通，分別爲以0爲初始或以-1爲初始
1.以0爲初始

i	0	1	2	3	4	5	6	7	8	9	10
p	a	b	a	b	a	a	a	b	a	b	a
next	0	1

當i=0，1 next[0],next[1]分別初始爲0，1
當i=2,p的前2位爲 ab,因next[1]=1，則觀察ab的前1位和後1位是否相同，不同，所以next[2]=1(記住後面運算時若連1位相同都沒有則記爲1，即最小記爲1，其實看後面就知道意思是next[i]=0+1=1)
當i=3,p的前3位爲aba,因next[2]=1,則觀察aba的前1位和後1位是否相同，相同，則在原基礎上+1，即next[3]=1+1=2
當i=4,p的前4位爲abab,因next[3]=2,則觀察abab的前2位和後2位是否相同，相同，則在原基礎上+1，即next[4]=2+1=3
當i=5,p的前5位爲ababa,因next[4]=3,則觀察ababa的前3位和後3位是否相同，相同，則在原基礎上+1，即next[5]=3+1=4
當i=6,p的前6位爲ababaa,因next[5]=4,則觀察ababaa的前4位和後4位是否相同，不相同，則在原基礎上-1，觀察前3位和後3位是否相同，不同繼續-1，直到觀察到前2位和後2位相同，若不同再繼續減，後觀察到前1位和後1位相同，則next[6]=1+1=2
當i=7,p的前7位爲ababaaa,因next[5]=2,則觀察ababaaa的前2位和後2位是否相同，不相同，則在原基礎上-1，觀察前1位和後1位是否相同，相同，則next[7]=1+1=2
…
…
…

最終爲

i	0	1	2	3	4	5	6	7	8	9	10
p	a	b	a	b	a	a	a	b	a	b	a
next	0	1	1	2	3	4	2	2	3	4	5

2.以-1爲初始

i	0	1	2	3	4	5	6	7	8	9	10
p	a	b	a	b	a	a	a	b	a	b	a
next	-1	0

當i=0，1 next[0],next[1]分別初始爲-1，0
當i=2，p的前2位爲ab,因next[1]=0，則next[1]+1=1,觀察前1位和後1位是否相同，不同，則1-1=0，到0爲止，則next[2]=0（1-1=0中第一個1的意思即前1位和後1位是否相同中的1）
當i=3,p的前3位爲aba,因next[2]=0,則next[2]+1=1,則觀察的前1位和後1位是否相同，相同，則next[3]=1
當i=4,p的前4位爲abab,因next[3]=1,則next[3]+1=2,則觀察前2位和後2位是否相同，相同，則next[4]=2
當i=5,p的前5位爲ababa,因next[4]=2,則next[4]+1=3,則觀察前3位和後3位是否相同，相同，則next[4]=3
當i=6,p的前6位爲ababaa,因next[5]=3,則next[5]+1=4,則觀察前4位和後4位是否相同，不相同;則觀察前3位和後3位是否相同，不同;則觀察前2位和後2位是否相同，不相同;則觀察前1位和後1位是否相同，相同，則next[6]=1
當i=7,p的前6位爲ababaaa,因next[6]=1,則next[6]+1=2,則觀察前2位和後2位是否相同，不相同;則觀察前1位和後1位是否相同，相同，則next[7]=1
…
…
…

最終爲

i	0	1	2	3	4	5	6	7	8	9	10
p	a	b	a	b	a	a	a	b	a	b	a
next	-1	0	0	1	2	3	1	1	2	3	4

倆種方法的關係
觀察發現法1的next數組每項+1就是法2的next數組，所以考試時無論用哪一種都是可以的，只要分析或者看清是以什麼爲初值就行
其實還可以理解爲把法1的next數組向右移1位，並把首位賦值位-1

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

[數據結構筆記]KMP算法及手工求解next數組

KMP算法

筆記

結果

手工求解next數組方法

測試人員都是畫畫大神，讓我看看誰還不會用代碼圖？

Object.values()對象遍歷

網絡現代化通向雲原生應用的高速公路

面試官：說說你對序列化的理解

Lagrange插值法與Newton插值法

12306餘票及票價查詢

java.awt.Robot的mouseMove(x,y)效果不起作用

Blinn-Phong Reflectance Model

求解最長迴文子串

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結