給n個串,要找到一個字符串,這個字符串在這n個串裏都出現至少兩次,並且不套疊。
先把所有的字符串連接起來(注意用一個不會出現在原串裏的字符來分割,最好還是用不同的)
然後二分答案ans,去分段height數組,維護每一段裏面,n個最大的出現位置和最小的出現位置。
對於這n個串的每個串,最大位置-最小位置>=ans纔是可以的(否則要麼是隻出現一次,要麼是套疊)
還有注意特判一下沒有出現的情況。
詳情見代碼
#include<iostream>
#include<cstdio>
#include<cstring>
#include<vector>
using namespace std;
const int nMax = 300001;
char str[nMax+1];
int sa[nMax], rank[nMax], height[nMax];
int wa[nMax], wb[nMax], wv[nMax], wd[nMax];
int cmp(int *r, int a, int b, int l){
return r[a] == r[b] && r[a+l] == r[b+l];
}
void da(char *r, int n, int m){ // 倍增算法 r爲待匹配數組 n爲總長度 m爲字符範圍
int i, j, p, *x = wa, *y = wb, *t;
for(i = 0; i < m; i ++) wd[i] = 0;
for(i = 0; i < n; i ++) wd[x[i]=r[i]] ++;
for(i = 1; i < m; i ++) wd[i] += wd[i-1];
for(i = n-1; i >= 0; i --) sa[-- wd[x[i]]] = i;
for(j = 1, p = 1; p < n; j *= 2, m = p){
for(p = 0, i = n-j; i < n; i ++) y[p ++] = i;
for(i = 0; i < n; i ++) if(sa[i] >= j) y[p ++] = sa[i] - j;
for(i = 0; i < n; i ++) wv[i] = x[y[i]];
for(i = 0; i < m; i ++) wd[i] = 0;
for(i = 0; i < n; i ++) wd[wv[i]] ++;
for(i = 1; i < m; i ++) wd[i] += wd[i-1];
for(i = n-1; i >= 0; i --) sa[-- wd[wv[i]]] = y[i];
for(t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n; i ++){
x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? p - 1: p ++;
}
}
}
void calHeight(char *r, int n){ // 求height數組。
int i, j, k = 0;
for(i = 1; i <= n; i ++)
{
rank[sa[i]] = i;
//cout<<sa[i]<<endl;
}
for(i = 0; i < n; height[rank[i ++]] = k){
for(k ? k -- : 0, j = sa[rank[i]-1]; r[i+k] == r[j+k]; k ++);
}
}
int n;
int len[14];
char input[14][12000];
int minh[14];
int maxh[14];
int find(int sa)
{
if(sa<len[0]-1) return 0;
for(int i=0;i<=n-2;i++)
{
if(sa>=len[i] && sa<len[i+1]-1) return i+1;
}
return -1;
}
bool test(int ans)
{
int seq=0;
for(int i=len[n-1]-1;i>=1;i--)
{
//cout<<height[i]<<endl;
if(height[i]<ans)
{
bool ac=true;
seq=0;
for(int j=0;j<n;j++)
{
if(minh[j]==0x3f3f3f3f || maxh[j]==-1)//有的字符串裏沒有出現過
{
ac=false;
break;
}
if(maxh[j]-minh[j]<ans)//有套疊 || 次數不夠
{
ac=false;
break;
}
}
if(ac==true) return true;
memset(minh,0x3f,sizeof(minh));
memset(maxh,-1,sizeof(maxh));
}
else
{
if(seq==0)
{
seq+=2;
int ia=find(sa[i]);
int ib=find(sa[i-1]);
//cout<<sa[i]<<endl;
minh[ia]=min(minh[ia],sa[i]);
maxh[ia]=max(maxh[ia],sa[i]);
minh[ib]=min(minh[ib],sa[i-1]);
maxh[ib]=max(maxh[ib],sa[i-1]);
}
else
{
seq++;
int ib=find(sa[i-1]);
//cout<<sa[i-1]<<endl;
minh[ib]=min(minh[ib],sa[i-1]);
maxh[ib]=max(maxh[ib],sa[i-1]);
}
}
}
return false;
}
int main()
{
int t;
cin>>t;
while(t--)
{
cin>>n;
int pt=0;
for(int i=0;i<n;i++)
{
scanf("%s",input[i]);
if(i==0) len[i]=strlen(input[i])+1;
else len[i]=len[i-1]+strlen(input[i])+1;
//cout<<len[i]<<endl;
int temp_len=strlen(input[i]);
for(int j=0;j<temp_len;j++)
{
str[pt]=input[i][j];
pt++;
}
if(i==n-1) str[pt]=0;
else str[pt]=i+1;
pt++;
}
da(str,len[n-1],140);
calHeight(str,len[n-1]-1);
int l,r;
l=1;
r=10000;
int ans=0;
while(l<=r)
{
int mid=(l+r)/2;
memset(minh,0x3f,sizeof(minh));
memset(maxh,-1,sizeof(maxh));
if(test(mid)==true)
{
ans=max(ans,mid);
l=mid+1;
}
else r=mid-1;
}
printf("%d\n",ans);
}
return 0;
}