後綴數組二·重複旋律2 最長不重疊重複字串

 後綴數組二·重複旋律2

時間限制:5000ms

單點時限:1000ms

內存限制:256MB

描述

小Hi平時的一大興趣愛好就是演奏鋼琴。我們知道一個音樂旋律被表示爲長度爲 N 的數構成的數列。小Hi在練習過很多曲子以後發現很多作品自身包含一樣的旋律。

旋律可以表示爲一段連續的數列,相似的旋律在原數列不可重疊,比如在1 2 3 2 3 2 1 中 2 3 2 出現了一次,2 3 出現了兩次,小Hi想知道一段旋律中出現次數至少爲兩次的旋律最長是多少?

解題方法提示

輸入

第一行一個整數 N。1≤N≤100000

接下來有 N 個整數,表示每個音的數字。1≤數字≤1000

輸出

一行一個整數,表示答案。

樣例輸入

8
1 2 3 2 3 2 3 1

樣例輸出

2

題目大意:求出不重疊的至少出現兩次的長度最長的子串。

解題思路:省賽選拔貌似出了這個題目,當時不會後綴數組,現在還是不會,只是知道了

三個數組的含義是什麼就開始做題了。。。

容易想到二分答案然後check。

如何check:對於二分的一個長度,對於連續的height[i]>=k ,我們只要判斷最大的sa 和最小的sa的差值是

不是大於等於k就可以了。因爲sa代表後綴的起始位置,如果相差大於等於k說明沒有重疊。

 

#include<stdio.h>
#include<string.h>
#include<algorithm>
#include<vector>
#include<iostream>
using namespace std;
const int maxn = 20005*6; //空間開6倍
int wa[maxn],wb[maxn],wv[maxn],Ws[maxn];
int rak[maxn],height[maxn];
int sa[maxn];
int s[maxn];

/// sa[i] 排第i的是哪個串 rak[i] 第i個串排第幾
/// sa[1~n]有效 rak[0~n-1]有效
/// 定義 height[i]爲suffix(sa[i-1])和 suffix(sa[i]),即排名相鄰的後綴的最長公共前綴
/// height[2~n]有效
int cmp(int *r,int a,int b,int l)
{
    return r[a]==r[b]&&r[a+l]==r[b+l];
}

///m是計數排序上限 r是要處理的數組
///n是數組長度+1,最後一個元素的後一個位置
///計數排序最小元素從1開始
/// m的範圍 如果字符串只包含字母就取128 否則取最大的數字+1。
void init()
{
    memset(wa,0,sizeof(wa));
    memset(wb,0,sizeof(wb));
    memset(wv,0,sizeof(wv));
    memset(Ws,0,sizeof(Ws));
    memset(rak,0,sizeof(rak));
    memset(height,0,sizeof(height));
    memset(sa,0,sizeof(sa));

}
void da(int *r,int *sa,int n,int m) {
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0; i<m; i++) Ws[i]=0;
    for(i=0; i<n; i++) Ws[x[i]=r[i]]++;
    for(i=1; i<m; i++) Ws[i]+=Ws[i-1];
    for(i=n-1; i>=0; i--) sa[--Ws[x[i]]]=i;
    for(p=1,j=1; p<n; j*=2,m=p)
    {
        for(p=0,i=n-j; i<n; i++) y[p++]=i;
        for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j;
        for(i=0; i<n; i++) wv[i]=x[y[i]];
        for(i=0; i<m; i++) Ws[i]=0;
        for(i=0; i<n; i++) Ws[wv[i]]++;
        for(i=1; i<m; i++) Ws[i]+=Ws[i-1];
        for(i=n-1; i>=0; i--) sa[--Ws[wv[i]]]=y[i];
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1; i<n; i++ )
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
}

void calheight(int *r,int *sa,int n)
{
    int i,j,k=0;
    for(i=1; i<=n; i++)
        rak[sa[i]]=i;
    for(i=0; i<n; height[rak[i++]]=k)
        for(k?k--:0,j=sa[rak[i]-1]; r[i+k]==r[j+k]; k++);
}

vector<int>lisan;

bool ok(int n, int vak)
{
    int mini;
    int mamx;
    for(int i=1; i<=n;)
    {
        if(height[i]<vak)
        {
            mini = sa[i];
            mamx = sa[i];
        }
        while(height[i]>=vak &&i<=n)
        {
            mini = min(mini,sa[i]);
            mamx = max(mamx,sa[i]);
            i++;
        }
        i++;
        if(mamx-mini>=vak)return true;
    }
    return false;
}
void read()
{
    int n;
    cin>>n;
    for(int i=0; i<n; i++) scanf("%d",s+i);
    s[n] = 0;
    da(s, sa, n+1, 1001);
    calheight(s, sa, n);
    int l =1, r =n-1;
    int ans=0;
    while(l<=r)
    {
        int mid = (l+r)>>1;
        if(ok(n,mid)) l = mid+1,ans=mid;
        else  r= mid-1;
    }
    printf("%d\n",ans);
}

int main()
{
    read();
}

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章