EOJ 1805 字符串匹配【後綴數組】

題目簡介


給你 2 個字符串(可能包括數字以及標點),長度不超過 50124,請你求出最長的連續的公共子序列。

說明


不知道是不是數據改了,導致這個似乎是n^2的算法也能暴力過去:

#include <bits/stdc++.h>
using namespace std;

int main()
{
    string a, b;
    int len, maxl = 0;
    cin >> a >> b;
    for (int i = 0; a[i]; ++i)
        for (int j = 0; b[j]; ++j)
        {
            len = 0;
            while (a[i] == b[j] && a[i] && b[j])
            {
                ++i; ++j; ++len;
                if (a[i] != b[j] || !a[i] || !b[j])
                {
                    --i; --j;
                    break;
                }
            }
            maxl = max(maxl, len);
        }
    printf("%d\n", maxl);
    return 0;
}

不過僅僅滿足於暴力還是不行的……這裏考慮到數據太大,採用了後綴數組+高度數組的辦法。不知道哈希是不是也可以?
順帶一提,string的size()方法返回unsigned int……轉成int後好像會-1,被坑慘了。

#include <bits/stdc++.h>
using namespace std;

const int maxn = 100200;
int n, k, ans;
string s, t;
int sa[maxn], rk[maxn], tmp[maxn], lcp[maxn];

bool cmp(int i, int j)
{
    if (rk[i] != rk[j]) return rk[i] < rk[j];
    int ri = i + k <= n ? rk[i + k] : -1;
    int rj = j + k <= n ? rk[j + k] : -1;
    return ri < rj;
}

void construct_sa()
{
    n = (int)s.size();
    for (int i = 0; i <= n; i++)
    {
        sa[i] = i;
        rk[i] = i < n ? s[i] : -1;
    }
    for (k = 1; k <= n; k <<= 1)
    {
        sort(sa, sa+n+1, cmp);
        tmp[sa[0]] = 0;
        for (int i = 1; i <= n; i++)
            tmp[sa[i]] = tmp[sa[i-1]] + cmp(sa[i-1], sa[i]);
        for (int i = 0; i <= n; i++)
            rk[i] = tmp[i];
    }
}

void construct_lcp()
{
    n = (int)s.size();
    for (int i = 0; i <= n; i++)
        rk[sa[i]] = i;
    int h = 0;
    lcp[0] = 0;
    for (int i = 0; i < n; i++)
    {
        int j = sa[rk[i]-1];
        if (h > 0) --h;
        for (; j+h < n && i+h < n; ++h)
            if (s[j+h] != s[i+h]) break;
        lcp[rk[i]-1] = h;
    }
}

int main()
{
    cin >> s >> t;
    int len = (int)s.size();
    s += ' ' + t;
    construct_sa();
    construct_lcp();
    for (int i = 0; i < s.size(); ++i)
        if ((sa[i] < len) != (sa[i+1] < len))
            ans = max(ans, lcp[i]);
    printf("%d\n", ans);
    return 0;
}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章