SPOJ 694 Distinct Substrings 後綴數組 模板

題目大意:給一個字符串,問這個字符串中不同的子串一共有多少個。

思路:構建後綴數組。如樣例ABABA的5個後綴排序後分別爲:

A

ABA

ABABA

BA

BABA

我們可以看作所有後綴的所有前綴構成所有的子串。

從上面可以看出,在A中,A第一次出現。在ABA中,AB和ABA第一次出現。在ABABA中,ABAB和ABABA第一次出現。

那麼容易看出,對於一個suffix(sa[i]),其中有height[i]個子串是和前一個重複了的。其他都沒有和前一個重複,而且他們都不會和之前所有的子串重複(因爲如果前面有和suffix(sa[i])的前綴子串重複的次數比suffix(sa[i-1])要多的話,它應該在suffix(sa[i])和suffix(sa[i-1])之間,這顯然不符合後綴數組的性質)

所以求出height[]數組後,總的子串數爲n*(n+1)/2,那麼答案就爲n*(n+1)/2 - sum{height[]}


#include<iostream>
#include<cstring>
#include<cstdio>
#include<ostream>
#include<istream>
#include<algorithm>
#include<queue>
#include<string>
#include<cmath>
#include<set>
#include<map>
#include<stack>
#include<vector>
#define fi first
#define se second
#define ll long long
#define pii pair<int,int>
#define inf (1<<30)
#define eps 1e-8
#define pb push_back
using namespace std;
const int maxn=110005;
char str[maxn];
int s[maxn];
/*
*suffix array
*倍增算法  O(n*logn)
*待排序數組長度爲n,放在0~n-1中,在最後面補一個0
*build_sa( ,n+1, );//注意是n+1;
*getHeight(,n);
*例如:
*n   = 8;
*num[]   = { 1, 1, 2, 1, 1, 1, 1, 2, $ };注意num最後一位爲0,其他大於0
*rank[]  = { 4, 6, 8, 1, 2, 3, 5, 7, 0 };rank[0~n-1]爲有效值,rank[n]必定爲0無效值
*sa[]    = { 8, 3, 4, 5, 0, 6, 1, 7, 2 };sa[1~n]爲有效值,sa[0]必定爲n是無效值
*height[]= { 0, 0, 3, 2, 3, 1, 2, 0, 1 };height[2~n]爲有效值
*
*/
int t1[maxn],t2[maxn],c[maxn];
int sa[maxn],rank[maxn],height[maxn];
void buildSa(int s[],int n,int m)//最大值小於m
{
    int i,j,p,*x=t1,*y=t2;
    for(i=0;i<m;i++)c[i]=0;
    for(i=0;i<n;i++)c[x[i]=s[i]]++;
    for(i=1;i<m;i++)c[i]+=c[i-1];
    for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
    for(j=1;j<=n;j<<=1)
    {
        p=0;
        for(i=n-j;i<n;i++)y[p++]=i;
        for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
        for(i=0;i<m;i++)c[i]=0;
        for(i=0;i<n;i++)c[x[y[i]]]++;
        for(i=1;i<m;i++)c[i]+=c[i-1];
        for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
        swap(x,y);
        p=1;x[sa[0]]=0;
        for(i=1;i<n;i++)
            x[sa[i]]=y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++;
        if(p>=n)break;
        m=p;
    }
}
void getHeight(int s[],int n)
{
    int i,j,k=0;
    for(i=0;i<=n;i++)rank[sa[i]]=i;
    for(i=0;i<n;i++)
    {
        if(k)k--;
        j=sa[rank[i]-1];
        while(s[i+k]==s[j+k])k++;
        height[rank[i]]=k;
    }
}
int main()
{
    int t;
    scanf("%d",&t);
    while(t--) {
        scanf("%s",str);
        int n=strlen(str);
        for(int i=0;i<=n;i++)
            s[i]=str[i];
        buildSa(s,n+1,128);
        getHeight(s,n);
        ll ans=n*(n+1)/2;
        for(int i=2;i<=n;i++)
            ans-=height[i];
        printf("%I64d\n",ans);
    }
    return 0;
}


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章