後綴數組二·重複旋律2
時間限制:5000ms
單點時限:1000ms
內存限制:256MB
描述
小Hi平時的一大興趣愛好就是演奏鋼琴。我們知道一個音樂旋律被表示爲長度爲 N 的數構成的數列。小Hi在練習過很多曲子以後發現很多作品自身包含一樣的旋律。
旋律可以表示爲一段連續的數列,相似的旋律在原數列不可重疊,比如在1 2 3 2 3 2 1 中 2 3 2 出現了一次,2 3 出現了兩次,小Hi想知道一段旋律中出現次數至少爲兩次的旋律最長是多少?
輸入
第一行一個整數 N。1≤N≤100000
接下來有 N 個整數,表示每個音的數字。1≤數字≤1000
輸出
一行一個整數,表示答案。
樣例輸入
8 1 2 3 2 3 2 3 1
樣例輸出
2
題目大意:求出不重疊的至少出現兩次的長度最長的子串。
解題思路:省賽選拔貌似出了這個題目,當時不會後綴數組,現在還是不會,只是知道了
三個數組的含義是什麼就開始做題了。。。
容易想到二分答案然後check。
如何check:對於二分的一個長度,對於連續的height[i]>=k ,我們只要判斷最大的sa 和最小的sa的差值是
不是大於等於k就可以了。因爲sa代表後綴的起始位置,如果相差大於等於k說明沒有重疊。
#include<stdio.h>
#include<string.h>
#include<algorithm>
#include<vector>
#include<iostream>
using namespace std;
const int maxn = 20005*6; //空間開6倍
int wa[maxn],wb[maxn],wv[maxn],Ws[maxn];
int rak[maxn],height[maxn];
int sa[maxn];
int s[maxn];
/// sa[i] 排第i的是哪個串 rak[i] 第i個串排第幾
/// sa[1~n]有效 rak[0~n-1]有效
/// 定義 height[i]爲suffix(sa[i-1])和 suffix(sa[i]),即排名相鄰的後綴的最長公共前綴
/// height[2~n]有效
int cmp(int *r,int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
///m是計數排序上限 r是要處理的數組
///n是數組長度+1,最後一個元素的後一個位置
///計數排序最小元素從1開始
/// m的範圍 如果字符串只包含字母就取128 否則取最大的數字+1。
void init()
{
memset(wa,0,sizeof(wa));
memset(wb,0,sizeof(wb));
memset(wv,0,sizeof(wv));
memset(Ws,0,sizeof(Ws));
memset(rak,0,sizeof(rak));
memset(height,0,sizeof(height));
memset(sa,0,sizeof(sa));
}
void da(int *r,int *sa,int n,int m) {
int i,j,p,*x=wa,*y=wb,*t;
for(i=0; i<m; i++) Ws[i]=0;
for(i=0; i<n; i++) Ws[x[i]=r[i]]++;
for(i=1; i<m; i++) Ws[i]+=Ws[i-1];
for(i=n-1; i>=0; i--) sa[--Ws[x[i]]]=i;
for(p=1,j=1; p<n; j*=2,m=p)
{
for(p=0,i=n-j; i<n; i++) y[p++]=i;
for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0; i<n; i++) wv[i]=x[y[i]];
for(i=0; i<m; i++) Ws[i]=0;
for(i=0; i<n; i++) Ws[wv[i]]++;
for(i=1; i<m; i++) Ws[i]+=Ws[i-1];
for(i=n-1; i>=0; i--) sa[--Ws[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1; i<n; i++ )
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
}
void calheight(int *r,int *sa,int n)
{
int i,j,k=0;
for(i=1; i<=n; i++)
rak[sa[i]]=i;
for(i=0; i<n; height[rak[i++]]=k)
for(k?k--:0,j=sa[rak[i]-1]; r[i+k]==r[j+k]; k++);
}
vector<int>lisan;
bool ok(int n, int vak)
{
int mini;
int mamx;
for(int i=1; i<=n;)
{
if(height[i]<vak)
{
mini = sa[i];
mamx = sa[i];
}
while(height[i]>=vak &&i<=n)
{
mini = min(mini,sa[i]);
mamx = max(mamx,sa[i]);
i++;
}
i++;
if(mamx-mini>=vak)return true;
}
return false;
}
void read()
{
int n;
cin>>n;
for(int i=0; i<n; i++) scanf("%d",s+i);
s[n] = 0;
da(s, sa, n+1, 1001);
calheight(s, sa, n);
int l =1, r =n-1;
int ans=0;
while(l<=r)
{
int mid = (l+r)>>1;
if(ok(n,mid)) l = mid+1,ans=mid;
else r= mid-1;
}
printf("%d\n",ans);
}
int main()
{
read();
}