所有下标均从1开始
最小表示法
给定一个串,求字典序最小的循环同构。
我们把串复制一遍接在后面,然后求出开始的长为的子串中最小的
先设
然后暴力找出和往后匹配的第一个不同的位置,记为和
如果,说明比优,所以不是最优解;然后发现比优,所以不是最优解……这样可以让直接跳到。
同理
如果,随便让一个即可
两个指针都不能超过,一个超过之后另一个就是答案
因为所有位置都会被遍历,而最优解一定不会被丢掉,所以正确性可以保证。
复杂度显然是
#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
char s[10005];
int main()
{
int T;
scanf("%d",&T);
while (T--)
{
scanf("%s",s);
int n=strlen(s);
int i=0,j=1;
while (i<n&&j<n)
for (int k=0;;k++)
{
if (s[(i+k)%n]!=s[(j+k)%n])
{
if (s[(i+k)%n]>s[(j+k)%n])
i+=k+1;
else
j+=k+1;
if (i==j) j++;
break;
}
if (k==n) goto end;
}
end:
printf("%d\n",min(i,j)+1);
}
return 0;
}
(远古代码,和上面讲的略有不同,仅供参考)
扩展KMP
官方名称应该叫Z算法,不知道为啥传到国内就变成扩展KMP了
但实际上思想和manacher很像所以应该叫扩展马拉车
解决的问题是给两个串,求 的每个后缀和 的最长公共前缀
先把接在后面,中间加个#
之类的东西 把这个串记为
然后设表示的从开始的后缀和(也可以是)的最长公共前缀
并且设公共前缀扩展到的最右位置为,取到这个最大值的为
然后从开始遍历(因为没有意义还会把算法搞砸)
如果
因为上下橙色位置相同,所以,当然要和取
如果,不管
然后暴力扩展,更新,没了
复杂度显然
#include <iostream>
#include <cstdio>
#include <cstring>
#include <cctype>
#define MAXN 200005
using namespace std;
char s[MAXN],t[MAXN];
int p[MAXN];
int main()
{
scanf("%s%s",t+1,s+1);
int m=strlen(s+1);
strcat(s+1,"#");
strcat(s+1,t+1);
int n=strlen(s+1);
for (int i=2,x=0,mx=0;i<=n;i++)
{
p[i]=i<=mx? min(p[i-x+1],mx-i+1):0;
while (s[i+p[i]]==s[p[i]+1]) ++p[i];
if (i+p[i]-1>mx) x=i,mx=i+p[i]-1;
}
for (int i=1;i<=n;i++)
if (s[i]=='#') puts("");
else printf("%d ",i>1? p[i]:m);
return 0;
}
Lyndon Word
定义:一个串是Lyndon Word(以下简称LW),当且仅当它本身是自己字典序最小的后缀
下文字符串的比较均为字典序,+
为字符串拼接
性质1 两个LW ,如果,那么是LW
对于的后缀,它比大,所以一定不是最小的;
对于,因为,所以
对于,因为,所以
所以是最小的
所以LW可以递归定义:
- 单个字符是LW
- 多个字典序递增的LW顺次拼接后是LW
性质2 LW的前缀仍是LW
考虑将原串不断丢掉最后的字符 那么会产生一个空后缀,将它删掉
然后前面的后缀相对大小不会变,所以仍然是LW
性质3 一个LW将最后一个字符变大后仍是LW
只有最后一个只包含一个字符的后缀变大,前面大小关系不变
性质4 任意字符串存在且仅存在一种分解方式,使得所有均为LW且单调不增
证明是不可能的,这辈子都是不可能的
把性质4中的分解称为Lyndon分解
接下来要讲的就是线性求Lyndon分解的Duval算法
首先三个指针,表示以前的分解已经固定,现在处理第个字符,一会儿说
即为,其中为LW且单调不增
为,其中是LW,是的可空前缀
也就是一个LW不断循环,最后一个循环节可以不完整
别问为啥,问就是归纳法
现在把加在后面,如果要继续循环,应该加的是,我们把这个应该跟的位置记为
如果,说明循环正常,继续往后
如果,根据性质3,最后一个不完整的循环节加上是个LW并且比前面的都大,不断向前合并发现整段都是LW。所以将一长串合并成新的,即令
如果 不管和大小关系,反正后面怎么加怎么都会小于,所以没啥事了,把所有固定下来
#include <iostream>
#include <cstdio>
#include <cstring>
#include <cctype>
#define MAXN (1<<20)+5
using namespace std;
char s[MAXN];
int main()
{
scanf("%s",s+1);
int n=strlen(s+1);
for (int i=1;i<=n;)
{
int j=i,k=i+1;
while (s[j]<=s[k])
{
if (s[j]==s[k]) ++j;
else j=i;
++k;
}
while (i<=j)
{
printf("%d ",i+k-j-1);
i+=k-j;
}
}
return 0;
}
我 华 灯 宴 呢