拓展KMP
模板问题
给出两个字符串匹配串 s , 模式串 p
请输出 s 的每一个后缀与 p 的最长公共前缀
核心:由已知的匹配,求出当前已知的最长匹配位置
exkmp[]
:表示模式串的每个后缀与模式串最长匹配长度
extend[]
:表示匹配串的后缀与模式串的最长匹配长度
利用kmp
的思想,用已得到的信息推出下一位
EXtend[]
若已得到
p
:为最长的已知匹配长度,即为
p0
:取到最长匹配长度的位置
k+1
:当前匹配位置
L
:exkmp[b]
即该点的最长匹配长度小于已知最长匹配长度
[l1,r1]
:[1,exkmp[b]]
[l2,r2]
:[k-p0+2,k-p0+1+exkmp[b]]
显然,红线、绿线、蓝线相等
那么,
if (i + exkmp[i + 1 - p0] < extend[p0] + p0)
// i相当于k+1,exkmp[i+1-p0] = exkmp[k+2-p0] = L
// 相当于 k + 1 + L < p0 + extend[p0] -> k + L < p0 + extend[p0] -1
extend[i] = exkmp[i + 1 - p0];
// extend[k+1] = L
即该点的最长匹配长度达到已知最长匹配长度
x
:(p,k+L]
s1
:[k+1,p]
s2
:[1,p-k]
s3
:[k-p0+2,p-p0+2]
显然,s1
,s2
,s3
相等
从p[p-k+1]
和s[p+1]
开始暴力匹配
now = extend[p0] + p0 - i + 1;
// p = extend[p0]+ p0 -1 ; i = k + 1
// now = p - k + 1
now = max(now, 1);
//防止特殊情况:k + 1 > p
while (now <= max_len && i - 1 + now <= len && p[now] == s[i - 1 + now]) now++;
//从p[p-k+1]和s[p+1]开始暴力匹配
extend[i] = now - 1;
//now为当前失配位置-1 即为匹配长度
p0 = i;
//更新p0
Exkmp[]
形如kmp
的next[]
数组
即为 自己配自己,自己的真后缀与自己最长匹配长度(第一位即本身)
exkmp[1] = max_len;
//第一位即本身
register int now = 1; //第二位开始暴力匹配
while (now + 1 <= max_len && p[now] == p[now + 1]) now++;
exkmp[2] = now - 1;
int p0 = 2;
for (int i = 3; i <= max_len; i++) {//重复拓展kmp即可
if (i + exkmp[i + 1 - p0] < exkmp[p0] + p0)
exkmp[i] = exkmp[i + 1 - p0];
else {
now = exkmp[p0] + p0 - i + 1;
now = max(now, 1);
while (i - 1 + now <= max_len && p[now] == p[i - 1 + now])
now++;
exkmp[i] = now - 1;
p0 = i;
}
}