【雅礼集训2017】字符串【后缀自动机】【数据分治】

题意:给定一个字符串SSmm个区间[li,ri][l_i,r_i],qq次询问,每次给定长度为kk的字符串ww和区间[a,b][a,b],求对于所有i[a,b]i\in[a,b]ww[li,ri][l_i,r_i]内的子串在SS中出现次数之和。

S,m,w105|S|,m,\sum|w|\leq10^5

看上去很不可做,但是有一个很难注意到的特殊性质:所有ww串长相等,所以kq105kq\leq10^5。后面记kq=wkq=w

所以k,qk,q中的较小值是根号级别的,考虑数据分治

首先肯定要先建出SS的后缀自动机

k<qk<q时,字符串很短,直接开k2k^2个vector记录所有区间出现的位置,然后暴力枚举ww的子串,在对应的vector用aabb二分一下算出有多少个区间,乘上在后缀自动机上的size。复杂度O(qk2logn)=O(wwlogn)O(qk^2\log n)=O(w\sqrt w\log n)

k>qk>q时,询问很少,可以每次单独处理。每次读入ww后先预处理出ww的每个前缀ii 最长的 是SS的子串 的 后缀长度LiL_i

然后暴力把[a,b][a,b]中的区间挂到rr上,从左到右扫一遍,设当前处理[l,r][l,r],如果Lr<rl+1L_r<r-l+1,说明这个子串没有出现过,直接跳过;否则在fail树上倍增找到最靠上的满足lenprl+1len_p\geq r-l+1的结点pp,这个子串就出现了sizpsiz_p次。复杂度O(qmlogn)=O(mwlogn)O(qm\log n)=O(m\sqrt w\log n)

某个k=qk=q的点用SOLVE2会卡常,所以特判成了SOLVE1

#include <iostream>
#include <cstdio>
#include <cstring>
#include <cctype>
#include <vector>
#include <algorithm>
#define MAXN 200005
using namespace std;
int ch[MAXN][26],fa[MAXN],tot=1,las=1;
int len[MAXN],siz[MAXN];
void insert(int c)
{
	int p=las,cur=++tot;
	len[cur]=len[las]+1,las=cur;
	for (;p&&!ch[p][c];p=fa[p]) ch[p][c]=cur;
	if (!p) fa[cur]=1;
	else
	{
		int q=ch[p][c];
		if (len[q]==len[p]+1) fa[cur]=q;
		else
		{
			int _q=++tot;
			len[_q]=len[p]+1;
			fa[_q]=fa[q],fa[q]=fa[cur]=_q;
			memcpy(ch[_q],ch[q],sizeof(ch[q]));
			for (;ch[p][c]==q;p=fa[p]) ch[p][c]=_q;
		}
	}
	siz[cur]=1;
}
int a[MAXN],c[MAXN],up[MAXN][20];
inline void build(int n)
{
	for (int i=1;i<=tot;i++) ++c[len[i]];
	for (int i=1;i<=n;i++) c[i]+=c[i-1];
	for (int i=tot;i;i--) a[c[len[i]]--]=i;
	for (int i=1;i<=tot;i++)
	{
		up[a[i]][0]=fa[a[i]];
		for (int j=1;j<20;j++) up[a[i]][j]=up[up[a[i]][j-1]][j-1];
	}
	for (int i=tot;i;i--) if (fa[a[i]]) siz[fa[a[i]]]+=siz[a[i]]; 
}
int n,m,k,q,l[MAXN],r[MAXN];
char s[MAXN],w[MAXN];
typedef long long ll;
namespace SOLVE1
{
	vector<int> lis[405][405];
	int pos[MAXN];
	void main()
	{
		for (int i=1;i<=m;i++) lis[l[i]][r[i]].push_back(i);
		while (q--)
		{
			int a,b;
			scanf("%s%d%d",w+1,&a,&b);
			++a,++b;
			ll ans=0;
			for (int i=1;i<=k;i++)
			{
				int now=1;
				for (int j=i;j<=k;j++)
				{
					now=ch[now][w[j]-'a'];
					if (!now) break;
					ans+=(ll)siz[now]*(upper_bound(lis[i][j].begin(),lis[i][j].end(),b)-upper_bound(lis[i][j].begin(),lis[i][j].end(),a-1));
				}
			}
			printf("%lld\n",ans);
		}
	}
}
namespace SOLVE2
{
	vector<int> lis[MAXN];
	int pos[MAXN],maxl[MAXN];
	void main()
	{
		while (q--)
		{
			int a,b;
			scanf("%s%d%d",w+1,&a,&b);
			++a,++b;
			ll ans=0;
			int now=1,curl=0;
			for (int i=a;i<=b;i++) lis[r[i]].push_back(l[i]);
			for (int i=1;i<=k;i++) 
			{
				while (now&&!ch[now][w[i]-'a']) now=fa[now],curl=len[now];
				now=ch[now][w[i]-'a'],++curl;
				if (!now) now=1,curl=0;
				pos[i]=now,maxl[i]=curl;
			}
			for (int p=1;p<=k;p++)
				for (int j=0;j<(int)lis[p].size();j++)
				{
					int u=pos[p],lim=p-lis[p][j]+1;
					if (maxl[p]<lim) continue;
					for (int i=19;i>=0;i--)
						if (len[up[u][i]]>=lim)
							u=up[u][i];
					ans+=siz[u];
				}
			printf("%lld\n",ans);
			for (int i=a;i<=b;i++) lis[r[i]].clear();
		}
	}
}
int main()
{
	scanf("%d%d%d%d",&n,&m,&q,&k);
	scanf("%s",s+1);
	for (int i=1;i<=n;i++) insert(s[i]-'a');
	build(n);
	for (int i=1;i<=m;i++) scanf("%d%d",&l[i],&r[i]),++l[i],++r[i];
	if (k<=q) 
		SOLVE1::main();
	else
		SOLVE2::main();
	return 0;
}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章