字符串搜索--Rabin-Karp算法

該算法採用數字指紋的思想,欲求m位目標字符串 p 在文本T中相同子串的位置轉化爲求p的指紋fp與文本T中一個m位窗口子串的指紋ft的關係。

有以下假設:

1. 如果fp!=ft ,則p與該窗口子串不匹配

2. 可以在O (m) 時間內計算p的指紋fp

3. 可以在 O (1) 時間內比較fp 和 ft 的大小關係

4. 可以在 O (1) 時間內利用前一個ft 計算 窗口位移一位後子串的指紋ft'


理想化算法:

利用哈希函數特點縮短對m位目標字符串p計算指紋的時間 h = p mod q。

該思想可以延伸到二維空間

當d位字母的字母表時,可以採用d進制數替代字母。



#include <iostream>
#include <algorithm>
#include <string.h>
#include <ctype.h>
#include <vector>
#include <map>
#include <cmath>
#include <set>
#define MAX(a,b) (a)>(b)?(a):(b)
const int MAXSIZE = 4010;
using namespace std;
char T[50];
char p[20];
const int q = 97;
int Rabin_karpSearch(char *T, char *p){//		Rabin-Karp算法,p爲目標字串,T爲文本
	int m = strlen(p);
	int n = strlen(T);
	int k;
	int c = ((int)pow(10, m-1)  % q);//			預處理
	int ft = 0, fp = 0;
	for (int i = 0; i < m; i++){				//計算p和T的指紋fp和ft初始值
		fp = (10 * fp + (p[i] - '0')) % q;
		ft = (10 * ft + (T[i] - '0')) % q;
	}
	for (int j = 0; j <= n - m; j++){			//從T[0...n-m]移動m位的窗口
		if (fp == ft){
			for ( k = 0; k < m; k++){
				if (p[k] != T[j + k])
					break;
			}
			if (k == m)
				return j;
		}
			ft = ((ft - c*(T[j] - '0')) * 10 + (T[j + m] - '0')) % q;//利用前一次的ft計算窗口向右移動一位的ft'
			if (ft < 0)		//保證ft > 0
				ft += q;
	}
	return -1;
}
int main()
{
	gets(T);
	gets(p);
	cout<<Rabin_karpSearch(T,p)<<endl;
	return 0;
}


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章