一、內容
小t非常感謝大家幫忙解決了他的上一個問題。然而病毒侵襲持續中。在小t的不懈努力下,他發現了網路中的“萬惡之源”。這是一個龐大的病毒網站,他有着好多好多的病毒,但是這個網站包含的病毒很奇怪,這些病毒的特徵碼很短,而且只包含“英文大寫字符”。當然小t好想好想爲民除害,但是小t從來不打沒有準備的戰爭。知己知彼,百戰不殆,小t首先要做的是知道這個病毒網站特徵:包含多少不同的病毒,每種病毒出現了多少次。大家能再幫幫他嗎?
Input
第一行,一個整數N(1<=N<=1000),表示病毒特徵碼的個數。
接下來N行,每行表示一個病毒特徵碼,特徵碼字符串長度在1—50之間,並且只包含“英文大寫字符”。任意兩個病毒特徵碼,不會完全相同。
在這之後一行,表示“萬惡之源”網站源碼,源碼字符串長度在2000000之內。字符串中字符都是ASCII碼可見字符(不包括回車)。
Output
按以下格式每行一個,輸出每個病毒出現次數。未出現的病毒不需要輸出。
病毒特徵碼: 出現次數
冒號後有一個空格,按病毒特徵碼的輸入順序進行輸出。
Sample Input
3
AA
BB
CC
ooxxCC%dAAAoen....END
Sample Output
AA: 2
CC: 1
Hint
Hit:
題目描述中沒有被提及的所有情況都應該進行考慮。比如兩個病毒特徵碼可能有相互包含或者有重疊的特徵碼段。
計數策略也可一定程度上從Sample中推測。
二、思路
- ac自動機模板題, 輸出次數即可。
三、代碼
#include <cstdio>
#include <cstring>
#include <queue>
using namespace std;
const int N = 1005, M = 2e6 + 5;
int n, len, tr[N * 50][128], ne[N * 50], ans[N], tail[N * 50];
char s[N][55], str[M];
void add(int id) {
int p = 0;
for (int i = 0; s[id][i]; i++) {
int j = s[id][i];
if (!tr[p][j]) tr[p][j] = ++len;
p = tr[p][j];
}
tail[p] = id;
}
void build() {
queue<int> q;
for (int i = 0; i < 128; i++) {
if (tr[0][i]) q.push(tr[0][i]);
}
while (!q.empty()) {
int p = q.front(); q.pop();
for (int j = 0; j < 128; j++) {
int c = tr[p][j];
if (!c) tr[p][j] = tr[ne[p]][j];
else {
ne[c] = tr[ne[p]][j];
q.push(c);
}
}
}
}
int main() {
while (~scanf("%d", &n)) {
memset(ans, 0, sizeof(ans));
memset(tr, 0, sizeof(tr));
memset(tail, 0, sizeof(tail)); len = 0;
memset(ne, 0, sizeof(ne));
for (int i = 1; i <= n; i++) {
scanf("%s", s[i]); add(i);
}
build();
scanf("%s", str + 1);
int m = strlen(str + 1);
for (int i = 1, j = 0; i <= m; i++) {
int t = str[i];
j = tr[j][t];
t = j;
while (t) {
if (tail[t]) ans[tail[t]]++;
t = ne[t];
}
}
for (int i = 1; i <= n; i++) {
if (ans[i]) printf("%s: %d\n", s[i], ans[i]);
}
}
return 0;
}