Repeats SPOJ (後綴數組,尋找一個重複次數最多的子串)

思路:
如果說有一個循環節長度爲k的字符串出現,那麼,字符串裏必定有str[0],str[k],str[2*k]….中的至少2個,在那個子串裏。

所以就直接枚舉循環節長度k,向後匹配,向前匹配,看看最長能到幾個。

向後匹配直接用LCP,RMQ的方法就可以了。
向前匹配,我看有些人是倒置,然後又求了一遍後綴數組。
但其實不用這樣,可以用向後匹配的個數。

因爲,如果要存在循環長度爲k的子串,顯然最後匹配出來的長度必定是k的整數倍 。
如果向後匹配的個數不是k的整數倍,也就意味着,如果有循環節長度爲k的子串的話,前面還有東西,而且前面必須是加起來可以湊夠k的整數倍的。

設j是你現在匹配的位置,i是你枚舉的循環節長度,tmp存的是向後匹配的最大長度。
那麼就相當於你的向前匹配的開始位置在 :j-(i-tmp%i);(不理解的話,就拿樣例做一做就知道了)
如果最終長度是k的整數倍的話,就可以更新答案了。

#include<iostream>
#include<cstdio>
#include<cstring>
#include<vector>
using namespace std;
const int nMax = 1200001;

char input[2];
char arr[nMax+1];
int sa[nMax], rank[nMax], height[nMax];
int wa[nMax], wb[nMax], wv[nMax], wd[nMax];
int n;
int cmp(int *r, int a, int b, int l){
    return r[a] == r[b] && r[a+l] == r[b+l];
}

void da(char *r, int n, int m){          //  倍增算法 r爲待匹配數組  n爲總長度 m爲字符範圍
    int i, j, p, *x = wa, *y = wb, *t;
    for(i = 0; i < m; i ++) wd[i] = 0;
    for(i = 0; i < n; i ++) wd[x[i]=r[i]] ++;
    for(i = 1; i < m; i ++) wd[i] += wd[i-1];
    for(i = n-1; i >= 0; i --) sa[-- wd[x[i]]] = i;
    for(j = 1, p = 1; p < n; j *= 2, m = p){
        for(p = 0, i = n-j; i < n; i ++) y[p ++] = i;
        for(i = 0; i < n; i ++) if(sa[i] >= j) y[p ++] = sa[i] - j;
        for(i = 0; i < n; i ++) wv[i] = x[y[i]];
        for(i = 0; i < m; i ++) wd[i] = 0;
        for(i = 0; i < n; i ++) wd[wv[i]] ++;
        for(i = 1; i < m; i ++) wd[i] += wd[i-1];
        for(i = n-1; i >= 0; i --) sa[-- wd[wv[i]]] = y[i];
        for(t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n; i ++){
            x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? p - 1: p ++;
        }
    }
}

void calHeight(char *r, int n){           //  求height數組。
    int i, j, k = 0;
    for(i = 1; i <= n; i ++)
    {
        rank[sa[i]] = i;
        //cout<<sa[i]<<endl;
    }
    for(i = 0; i < n; height[rank[i ++]] = k){
        for(k ? k -- : 0, j = sa[rank[i]-1]; r[i+k] == r[j+k]; k ++);
    }
}

int rmq[80000][20];

void init_RMQ(int n)
{
    memset(rmq,0x3f,sizeof(rmq));
    for(int i=1;i<=n;i++) rmq[i][0]=height[i];
    for(int j=1;(1<<j)<=n;j++)
    {
        for(int i=1;i+(1<<j)-1<=n;i++)
        {
            rmq[i][j]=min(rmq[i][j-1],rmq[i+(1<<(j-1))][j-1]);
        }
    }
}

int RMQ(int L,int R)
{
    if(L>=R) swap(L,R);
    int k=0;
    while((1<<(k+1)<=R-L+1)) k++;
    return min(rmq[L][k],rmq[R-(1<<k)+1][k]);
}

int main()
{
    int t;
    cin>>t;
    while(t--)
    {
        int pt=0;
        scanf("%d",&n);
        for(int i=0;i<n;i++)
        {
            scanf("%s",input);
            arr[i]=input[0];
        }
        arr[n]=0;
        arr[n+1]='\0';

        da(arr,n+1,130);
        calHeight(arr,n);

        init_RMQ(n);

        int ans=1;
        for(int i=1;i<=n;i++)//枚舉的是循環節的長度
        {
            for(int j=0;j+i<n;j+=i)
            {
                int tmp;
                if(rank[j]<rank[j+i])
                {
                    tmp=RMQ(rank[j]+1,rank[j+i]);
                }
                else
                {
                    tmp=RMQ(rank[j+i]+1,rank[j]);
                }

                int ns=j-(i-tmp%i);
                if(ns<0) continue;
                if(rank[ns]<rank[ns+i])
                {
                    tmp=RMQ(rank[ns]+1,rank[ns+i]);
                }
                else
                {
                    tmp=RMQ(rank[ns+i]+1,rank[ns]);
                }

                if(tmp%i!=0) continue;
                else ans=max((tmp/i)+1,ans);
            }
        }

        cout<<ans<<endl;
    }


    return 0;
}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章