HDU 6194 後綴數組+單調棧

題意:

題目鏈接:http://acm.hdu.edu.cn/showproblem.php?pid=6194
找到一個字符串中恰好出現k次的子串的數目。


思路:

計算出height數組,根據height數組進行操作,因爲子串恰好出現k次,很顯然需要找到一個長度爲k-1的區間,這個區間要滿足區間兩邊的height都比區間內的最小值要小,這樣利用單調棧求出每個height左右兩邊第一個比height小的位置,如果左右兩個位置包括的區間長度正好爲k-1,那麼所枚舉的這個height減去左右兩邊height的最大值就是需要統計的恰好出現k次的子串數目。
有兩點需要注意,第一是需要單獨考慮k==1的情況,第二是對於同一段的相同數字,比如:1,2,3,2,1;此時兩個2的左右區間都相同,只需要考慮一個2,這在求利用單調棧時標記一下即可。


代碼:

#include <bits/stdc++.h>
using namespace std;
typedef long long LL;
const int MAXN = 1e5 + 10;
const int INF = 0x3f3f3f3f;

int n;
int t1[MAXN], t2[MAXN], c[MAXN];

bool cmp(int *r, int a, int b, int l) {
    return r[a] == r[b] && r[a + l] == r[b + l];
}

void build(int a[],int sa[],int rk[],int height[],int n,int m) {
    n++;
    int i, j, p, *x = t1, *y = t2;
    //第一輪基數排序,如果s的最大值很大,可改爲快速排序
    for(i = 0; i < m; i++) c[i] = 0;
    for(i = 0; i < n; i++) c[x[i] = a[i]]++;
    for(i = 1; i < m; i++) c[i] += c[i-1];
    for(i = n-1; i >= 0; i--) sa[--c[x[i]]] = i;
    for(j = 1; j <= n; j <<= 1) {
        p = 0;
        //直接利用sa數組排序第二關鍵字
        for(i = n-j; i < n; i++)y[p++] = i;//後面的j個數第二關鍵字爲空的最小
        for(i = 0; i < n; i++)if(sa[i] >= j)y[p++] = sa[i] - j;
        //這樣數組y保存的就是按照第二關鍵字排序的結果
        //基數排序第一關鍵字
        for(i = 0; i < m; i++) c[i] = 0;
        for(i = 0; i < n; i++) c[x[y[i]]]++;
        for(i = 1; i < m; i++) c[i] += c[i-1];
        for(i = n-1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];
        //根據sa和x數組計算新的x數組
        swap(x,y);
        p = 1;
        x[sa[0]] = 0;
        for(i = 1; i < n; i++)
            x[sa[i]] = cmp(y,sa[i-1],sa[i],j)?p-1:p++;
        if(p >= n)break;
        m = p;//下次基數排序的最大值
    }
    int k = 0;
    n--;
    for(i = 0; i <= n; i++)rk[sa[i]] = i;
    for(i = 0; i < n; i++)
    {
        if(k)   k--;
        j = sa[rk[i]-1];
        while(a[i+k] == a[j+k])
            k++;
        height[rk[i]] = k;
    }
}

int sa[MAXN], height[MAXN], rk[MAXN], a[MAXN];
int L[MAXN], R[MAXN];
char s[MAXN];
bool vis[MAXN];
stack <int> sta;

int main(){
    //freopen("in.txt", "r", stdin);
    int T;
    scanf("%d", &T);
    while (T--) {
        int k;
        scanf("%d%s", &k, s);
        n = strlen(s);
        for (int i = 0; i < n; i++)
            a[i] = s[i] - 'a' + 1;
        a[n] = 0;
        build(a, sa, rk, height, n, 27);
        height[0] = height[n + 1] = 0;
        LL ans = 0;
        if (k == 1) {
            for (int i = 1; i <= n; i++) {
                    int tmp = n - sa[i] - max(height[i], height[i + 1]);
                    if (tmp > 0) ans += tmp;
            }
        }
        else {
            while (!sta.empty()) sta.pop();
            for (int i = 1; i <= n; i++) {
                vis[i] = true;
                while (!sta.empty() && height[sta.top()] >= height[i]) sta.pop();
                if (sta.empty()) L[i] = 0;
                else L[i] = sta.top();
                sta.push(i);
            }
            while (!sta.empty()) sta.pop();
            for (int i = n; i >= 1; i--) {
                while (!sta.empty() && height[sta.top()] >= height[i]) {
                    if (height[sta.top()] == height[i]) vis[sta.top()] = false;
                    sta.pop();
                }
                if (sta.empty()) R[i] = n + 1;
                else R[i] = sta.top();
                sta.push(i);
            }
            for (int i = 1; i <= n; i++) {
                if (!vis[i]) continue;
                if (R[i] - L[i] != k) continue;
                ans += (LL)(height[i] - max(height[L[i]], height[R[i]]));
            }
        }
        printf("%I64d\n", ans);
    }
    return 0;
}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章