該算法採用數字指紋的思想,欲求m位目標字符串 p 在文本T中相同子串的位置轉化爲求p的指紋fp與文本T中一個m位窗口子串的指紋ft的關係。
有以下假設:
1. 如果fp!=ft ,則p與該窗口子串不匹配
2. 可以在O (m) 時間內計算p的指紋fp
3. 可以在 O (1) 時間內比較fp 和 ft 的大小關係
4. 可以在 O (1) 時間內利用前一個ft 計算 窗口位移一位後子串的指紋ft'
理想化算法:
利用哈希函數特點縮短對m位目標字符串p計算指紋的時間 h = p mod q。
該思想可以延伸到二維空間
當d位字母的字母表時,可以採用d進制數替代字母。
#include <iostream>
#include <algorithm>
#include <string.h>
#include <ctype.h>
#include <vector>
#include <map>
#include <cmath>
#include <set>
#define MAX(a,b) (a)>(b)?(a):(b)
const int MAXSIZE = 4010;
using namespace std;
char T[50];
char p[20];
const int q = 97;
int Rabin_karpSearch(char *T, char *p){// Rabin-Karp算法,p爲目標字串,T爲文本
int m = strlen(p);
int n = strlen(T);
int k;
int c = ((int)pow(10, m-1) % q);// 預處理
int ft = 0, fp = 0;
for (int i = 0; i < m; i++){ //計算p和T的指紋fp和ft初始值
fp = (10 * fp + (p[i] - '0')) % q;
ft = (10 * ft + (T[i] - '0')) % q;
}
for (int j = 0; j <= n - m; j++){ //從T[0...n-m]移動m位的窗口
if (fp == ft){
for ( k = 0; k < m; k++){
if (p[k] != T[j + k])
break;
}
if (k == m)
return j;
}
ft = ((ft - c*(T[j] - '0')) * 10 + (T[j + m] - '0')) % q;//利用前一次的ft計算窗口向右移動一位的ft'
if (ft < 0) //保證ft > 0
ft += q;
}
return -1;
}
int main()
{
gets(T);
gets(p);
cout<<Rabin_karpSearch(T,p)<<endl;
return 0;
}