題意:
題目鏈接:http://acm.hdu.edu.cn/showproblem.php?pid=5769
求一個字符串中包含字符x的不同子串有多少個
思路:
處理出height數組,對於每個後綴i,二分得出i之後的第一個字符x的位置,max(x,sa[i]+height[i])之後的位置結尾得到的字符串都是唯一的,相見代碼。
代碼:
#include <bits/stdc++.h>
using namespace std;
typedef long long LL;
const int MAXN = 1e5 + 10;
const int INF = 0x3f3f3f3f;
int t1[MAXN], t2[MAXN], c[MAXN];
bool cmp(int *r, int a, int b, int l) {
return r[a] == r[b] && r[a + l] == r[b + l];
}
void build(int a[],int sa[],int rk[],int height[],int n,int m) {
n++;
int i, j, p, *x = t1, *y = t2;
//第一輪基數排序,如果s的最大值很大,可改爲快速排序
for(i = 0; i < m; i++) c[i] = 0;
for(i = 0; i < n; i++) c[x[i] = a[i]]++;
for(i = 1; i < m; i++) c[i] += c[i-1];
for(i = n-1; i >= 0; i--) sa[--c[x[i]]] = i;
for(j = 1; j <= n; j <<= 1) {
p = 0;
//直接利用sa數組排序第二關鍵字
for(i = n-j; i < n; i++)y[p++] = i;//後面的j個數第二關鍵字爲空的最小
for(i = 0; i < n; i++)if(sa[i] >= j)y[p++] = sa[i] - j;
//這樣數組y保存的就是按照第二關鍵字排序的結果
//基數排序第一關鍵字
for(i = 0; i < m; i++) c[i] = 0;
for(i = 0; i < n; i++) c[x[y[i]]]++;
for(i = 1; i < m; i++) c[i] += c[i-1];
for(i = n-1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];
//根據sa和x數組計算新的x數組
swap(x,y);
p = 1;
x[sa[0]] = 0;
for(i = 1; i < n; i++)
x[sa[i]] = cmp(y,sa[i-1],sa[i],j)?p-1:p++;
if(p >= n)break;
m = p;//下次基數排序的最大值
}
int k = 0;
n--;
for(i = 0; i <= n; i++)rk[sa[i]] = i;
for(i = 0; i < n; i++)
{
if(k) k--;
j = sa[rk[i]-1];
while(a[i+k] == a[j+k])
k++;
height[rk[i]] = k;
}
}
int sa[MAXN], height[MAXN], rk[MAXN], a[MAXN];
char s[MAXN], t[2];
vector <int> vec;
vector <int> :: iterator it;
int main(){
//freopen("in.txt", "r", stdin);
int T, cs = 0;
scanf("%d", &T);
while (T--) {
scanf("%s%s", t, s);
int n = strlen(s);
vec.clear();
for (int i = 0; i < n; i++) {
a[i] = s[i];
if (s[i] == t[0]) vec.push_back(i);
}
a[n] = 0;
build(a, sa, rk, height, n, 128);
LL ans = 0;
for (int i = 1; i <= n; i++) {
it = lower_bound(vec.begin(), vec.end(), sa[i]);
if (it == vec.end()) continue;
int tmp = n - sa[i] - max(height[i], *it - sa[i]);
if (tmp > 0) ans += tmp;
}
printf("Case #%d: %I64d\n", ++cs, ans);
}
return 0;
}