(六)Brute-Force算法與KMP算法

串的模式匹配操作

在字符串匹配問題中,我們期待察看S串中是否含有串T(模式串)。其中串S被稱爲主串,串T被稱爲子串。
如果在主串中查找到子串,則稱爲模式匹配成功,返回模式串的第一個字符在主串中出現的位置。
如果在主串中未找到子串,則稱爲模式匹配失敗,返回-1。
Brute-Force與KMP算法是兩種最經典的模式匹配算法。

Brute-Force算法

也稱簡單匹配算法,其基本思路是:從目標串s=”s0s1…sn-1”的第一個字符開始和模式串t=”t0t1…tm-1”中的第一個字符比較,若相等,則繼續逐個比較後續字符,否則,從目標串s的第2個字符開始重新與模式串t的第一個字符進行比較,依次類推,若從目標串s的第i個字符開始,每個字符依次和模式串t中的對應字符相等,則匹配成功,該算法返回i;否則匹配失敗,返回-1。 
設主串s=“cddcdc”,模式串t=“cdc”,模式匹配過程如圖:
public static int bruteforce(String source, String sub) {
		int j = 0, i = 0,index=-1;
		while (i < source.length() && j < sub.length()) {
			if (source.charAt(i) == sub.charAt(j)) 
			{
				i++; j++;
			} else {
// 使i回退到下一個字符,應爲子串的前面j向可能匹配成功,而第j+1項失敗,所以 i=i-j+1
				i = i - j + 1;
				j = 0;
			}
		}
         if (j == sub.length()) {
				index = i - sub.length();
			} else {
				index = -1;
			}

		return index;
	}

Brute-Force算法總結:

該方法的優點是:算法簡單明朗,便於實現記憶。

缺點是:進行了回溯,效率不高,而這些都是沒有必要的。比如下圖:



KMP算法

Brute-Force被稱爲簡單模式匹配算法。KMP算法是它的改進算法。
一種改進的字符串匹配算法,由D.E.Knuth與V.R.Pratt和J.H.Morris同時發現,因此稱之爲KMP算法。此算法可以在O(n+m)的時間數量級上完成串的模式匹配操作,其基本思想是:每當匹配過程中出現字符串比較不等時,不需回溯指針,而是利用已經得到的“部分匹配”結果將模式向右“滑動”儘可能遠的一段距離,繼續進行比較。

模式串求最大真子串

例如:求aaaab next[j]。

計算模式串的next[j]
當Si≠Tj,若模式串存在最大真子串,可將模式串T按照k=next[j]的值向右滑動,然後比較Si和Tk,若仍有Si≠Tk,則模式串T按照新的k=next[j]的值向右滑動後比較。這樣的過程一直進行到k=next[k]=0,此時若Si≠T0,則模式串T不再向右滑動,隨後比較Si+1和T0。

例如:主串爲"aaaaaaab",子串爲"aaaab",求採用KMP的模式匹配過程。


//KMP算法
public class KMP {

	//根據給定的模式串,求next[j]的算法
	public static int[] getNext(String sub)
	{
		int j=1,k=0;
		int[] next = new int[sub.length()];
		next[0]=-1;
		next[1]=0;
		
		while(j<sub.length()-1)
		{
			if(sub.charAt(j)==sub.charAt(k))
			{
				next[j+1]=k+1;
				j++;
				k++;
			}
			else if(k==0)
			{
				next[j+1]=0;
				j++;
			}
			else
			{
				k=next[k];
			}
		}
		return next;
	}
	
	//根據給定主串和子串,採用KMP算法
	public static int kmp(String src,String sub)
	{
		//先生成模式串sub的next[j]
		int[] next = getNext(sub);
		
		//i:主串的遊標
		//j:子串的遊標
		int i=0,j=0,index=-1;
		while(i<src.length()&&j<sub.length())
		{
			if(src.charAt(i)==sub.charAt(j))
			{
				i++;
				j++;
			}
			else if(j==0)
			{
				i++;
			}
			else
			{
				j=next[j]; //向右滑動
			}
				
		}
		if(j==sub.length())
		{
			index = i-sub.length();
		}
		return index;
	}
}


發佈了31 篇原創文章 · 獲贊 3 · 訪問量 9萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章