[BZOJ 4310] 跳蚤

一、題目

點此看題

二、解法

答案一定具有單調性,我們可以二分答案的字典序排名,利用後綴數組可以O(n)O(n)將排名轉化成在SS串中的位置[L,R][L,R]。具體就是枚舉排名爲ii的後綴,算出它們子串的貢獻,如果子串個數達到就可以找到位置,否則加上貢獻繼續找。

考慮如何檢查,我們從後往前掃,每次貪心地加入一個字符,中途維護劃分的子串區間[i,j][i,j],直接把[i,j][i,j][L,R][L,R]比較大小,如果[i,j][i,j]字典序更大就需要從ii處劃分成[i,i][i,i][i+1,j][i+1,j],因爲[i+1,j][i+1,j]一定是合法的,這樣劃分一定最優(貪心,感性理解就行了),然後注意i=ji=j是就無解(因爲劃分不了),最後判斷一下劃分次數需要小於段數。

如何快速比較字符串中兩個子串的大小呢?先特判左端點相等的情況,然後用stst表+後綴數組O(1)O(1)算出兩個左端點後綴的最長公共前綴,這裏要討論多種情況,記最長公共前綴長度爲lenlen,第一個子串爲len1len1,第二個爲len2len2

  • 如果lenlenlen1,len2len1,len2都大,直接比較len1len1len2len2的大小,大的字典序大
  • 如果lenlen只比其中一個大,比哪一個大哪一個字典序就小
  • 否則比較s[l1+len]s[l_1+len]s[l2+len]s[l_2+len]即可,大的字典序大

總時間複雜度O(nlogn)O(n\log n)stst表的loglog函數建議手動打表(好像longlonglong longcmathcmath裏的loglog函數會炸),口胡可能難以理解,請看代碼。

#include <cstdio>
#include <cstring>
#include <iostream>
#include <cmath>
using namespace std;
const int M = 200005;
#define int long long
int read()
{
    int x=0,flag=1;
    char c;
    while((c=getchar())<'0' || c>'9') if(c=='-') flag=-1;
    while(c>='0' && c<='9') x=(x<<3)+(x<<1)+(c^48),c=getchar();
    return x*flag;
}
int n,m,k,x[M],y[M],c[M],sa[M],rk[M],hi[M];
char s[M];int dp[M][20],l,r,L,R,ans,lg[M];
void get_sa()
{
    for(int i=1;i<=n;i++) ++c[x[i]=s[i]];
    for(int i=2;i<=m;i++) c[i]+=c[i-1];
    for(int i=n;i>=1;i--) sa[c[x[i]]--]=i;
    for(int k=1;k<=n;k<<=1)
    {
        int num=0;
        for(int i=n-k+1;i<=n;i++) y[++num]=i;
        for(int i=1;i<=n;i++) if(sa[i]>k) y[++num]=sa[i]-k;
        for(int i=1;i<=m;i++) c[i]=0;
        for(int i=1;i<=n;i++) ++c[x[i]];
        for(int i=2;i<=m;i++) c[i]+=c[i-1];
        for(int i=n;i>=1;i--) sa[c[x[y[i]]]--]=y[i],y[i]=0;
        swap(x,y);
        x[sa[1]]=1;num=1;
        for(int i=2;i<=n;i++)
            x[sa[i]]=(y[sa[i]]==y[sa[i-1]] && y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
        if(num==n) break;
        m=num;
    }
}
void get_hi()
{
    int k=0;
    for(int i=1;i<=n;i++) rk[sa[i]]=i;
    for(int i=1;i<=n;i++)
    {
        if(rk[i]==1) continue;
        if(k) k--;
        int j=sa[rk[i]-1];
        while(j+k<=n && i+k<=n && s[i+k]==s[j+k])
            k++;
        hi[rk[i]]=k;
    }
    for(int i=1;i<=n;i++)
        dp[i][0]=hi[i];
    for(int j=1;(1<<j)<=n;j++)
        for(int i=1;i+(1<<j)-1<=n;i++)
            dp[i][j]=min(dp[i][j-1],dp[i+(1<<(j-1))][j-1]);
    for(int i=1;i<=n;i++)
        r+=n-sa[i]+1-hi[i];
}
int ask(int l,int r)
{
    if(l>r) swap(l,r);l++;
    int len=r-l+1,k=lg[len];
    return min(dp[l][k],dp[r-(1<<k)+1][k]);
}
void kth(int k)
{
    int now=0;
    for(int i=1;i<=n;i++)
    {
        int j=sa[i],len=n-j+1-hi[i];
        if(now+len<k) {now+=len;continue;}
        k-=now;L=j,R=j+hi[i]+k-1;
        return ;
    }
}
int cmp(int x1,int y1,int x2,int y2)
{
    if(x1==x2)//要判,st表不能處理這種情況
    {
        if(y1>y2) return 1;
        if(y1<y2) return -1;
        return 0;
    }
    int len1=y1-x1+1,len2=y2-x2+1;
    int len=ask(rk[x1],rk[x2]);
    if(len>=len1 && len>=len2)
    {
        if(len1>len2) return 1;
        if(len1<len2) return -1;
        return 0;
    }
    if(len>=len1) return -1;
    if(len>=len2) return 1;
    if(s[x1+len]>s[x2+len]) return 1;
    return -1;
}
bool check()
{
    int cnt=0;
    for(int i=n,j=n;i>=1 && j>=1;)
    {
        if(cmp(L,R,i,j)!=-1) {i--;continue;}
        if(i==j) return 0;
        j=i;cnt++;
        if(cnt>=k) return 0;
    }
    return cnt<k;
}
signed main()
{
    k=read();
    scanf("%s",s+1),n=strlen(s+1);
    for(int i=2;i<=n;i++)
        lg[i]=lg[i>>1]+1;//建議手寫
    m=200;
    get_sa();
    get_hi();
    l=1;
    kth(4313);
    while(l<=r)
    {
        int mid=(l+r)>>1;kth(mid);
        if(check()) ans=mid,r=mid-1;
        else l=mid+1;
    }
    kth(ans);
    for(int i=L;i<=R;i++) printf("%c",s[i]);
    puts("");
}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章