題目
給定一個只包含小寫字母的字符串S(|S|<=1e6),
請你求出 S 的所有出現次數不爲 1 的子串的出現次數乘上該子串長度的最大值。
思路來源
https://www.cnblogs.com/cjyyb/p/8446349.html
題解
一個串的出現次數等於endpos集合的大小,
葉子結點的出現次數顯然爲1,因爲在樹上不可再分
而一個節點endpos的大小等於所有parent樹上兒子的大小
考慮到,父親的串一定比兒子的串短,所以對長度基數排拓撲序,
短的排在前面,長的在後面,然後從長的向短的(樹的底層向上層)更新,
這樣就不用建parent樹了,每個節點的size是其right/endpos集合的大小
對於每個size>1的節點,ans=max(longest∗size)
心得
size的大小可以單獨拿出來考慮,
如果放在node裏,在第三種情況nq複製節點的時候要將sz強制清零,
因爲只有葉子節點的大小是明確的1,
nq產生時,是一個分支節點,需要從後續兒子節點裏更新獲取sz
代碼
#include<bits/stdc++.h>
using namespace std;
const int N=1e6+10;
typedef long long ll;
struct SAM{
struct NODE
{
int ch[26];
int len,fa,sz;
NODE(){memset(ch,0,sizeof(ch));len=sz=0;}
}dian[N<<1];
int las=1,tot=1,len;//rt爲1 代表空串
char s[N];
void add(int c)
{
int p=las;int np=las=++tot;
dian[np].sz=1;
dian[np].len=dian[p].len+1;
for(;p&&!dian[p].ch[c];p=dian[p].fa)dian[p].ch[c]=np;
if(!p)dian[np].fa=1;//以上爲case 1
else
{
int q=dian[p].ch[c];
if(dian[q].len==dian[p].len+1)dian[np].fa=q;//以上爲case 2
else
{
int nq=++tot;dian[nq]=dian[q];
dian[nq].sz=0;
dian[nq].len=dian[p].len+1;
dian[q].fa=dian[np].fa=nq;
for(;p&&dian[p].ch[c]==q;p=dian[p].fa)dian[p].ch[c]=nq;//以上爲case 3
}
}
}
void init()
{
scanf("%s",s);len=strlen(s);
for(int i=0;i<len;i++)add(s[i]-'a');
}
}sam;
int c[N<<1],a[N<<1];//c用於基數排序 a用於記錄點號
ll ans;
int main()
{
sam.init();
for(int i=1;i<=sam.tot;++i)c[sam.dian[i].len]++;
for(int i=1;i<=sam.tot;++i)c[i]+=c[i-1];
for(int i=1;i<=sam.tot;++i)a[c[sam.dian[i].len]--]=i;
for(int i=sam.tot;i>=1;--i){
int now=a[i],par=sam.dian[now].fa;
sam.dian[par].sz+=sam.dian[now].sz;
if(sam.dian[now].sz>1){
ans=max(ans,1ll*sam.dian[now].sz*sam.dian[now].len);
}
}
printf("%lld\n",ans);
return 0;
}