Trie树计算单词前缀的个数

时间限制:10000ms
单点时限:1000ms
内存限制:256MB

描述

小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。

这一天,他们遇到了一本词典,于是小Hi就向小Ho提出了那个经典的问题:“小Ho,你能不能对于每一个我给出的字符串,都在这个词典里面找到以这个字符串开头的所有单词呢?

身经百战的小Ho答道:“怎么会不能呢!你每给我一个字符串,我就依次遍历词典里的所有单词,检查你给我的字符串是不是这个单词的前缀不就是了?

小Hi笑道:“你啊,还是太年轻了!~假设这本词典里有10万个单词,我询问你一万次,你得要算到哪年哪月去?”

小Ho低头算了一算,看着那一堆堆的0,顿时感觉自己这辈子都要花在上面了...

小Hi看着小Ho的囧样,也是继续笑道:“让我来提高一下你的知识水平吧~你知道树这样一种数据结构么?”

小Ho想了想,说道:“知道~它是一种基础的数据结构,就像这里说的一样!”

小Hi满意的点了点头,说道:“那你知道我怎么样用一棵树来表示整个词典么?”

小Ho摇摇头表示自己不清楚。

提示一:Trie树的建立

“你看,我们现在得到了这样一棵树,那么你看,如果我给你一个字符串ap,你要怎么找到所有以ap开头的单词呢?”小Hi又开始考校小Ho。

“唔...一个个遍历所有的单词?”小Ho还是不忘自己最开始提出来的算法。

“笨!这棵树难道就白构建了!”小Hi教训完小Ho,继续道:“看好了!”

提示二:如何使用Trie树

提示三:在建立Trie树时同时进行统计!

“那么现在!赶紧去用代码实现吧!”小Hi如是说道

输入

输入的第一行为一个正整数n,表示词典的大小,其后n行,每一行一个单词(不保证是英文单词,也有可能是火星文单词哦),单词由不超过10个的小写英文字母组成,可能存在相同的单词,此时应将其视作不同的单词。接下来的一行为一个正整数m,表示小Hi询问的次数,其后m行,每一行一个字符串,该字符串由不超过10个的小写英文字母组成,表示小Hi的一个询问。

在20%的数据中n, m<=10,词典的字母表大小<=2.

在60%的数据中n, m<=1000,词典的字母表大小<=5.

在100%的数据中n, m<=100000,词典的字母表大小<=26.

本题按通过的数据量排名哦~

输出

对于小Hi的每一个询问,输出一个整数Ans,表示词典中以小Hi给出的字符串为前缀的单词的个数。

样例输入
5
babaab
babbbaaaa
abba
aaaaabaa
babaababb
5
babb
baabaaa
bab
bb
bbabbaab
样例输出
1
0
3
0

0

这是一道hiho上的题目,主要方法是Trie树,俗称字典树,是一种高效存储海量单词的结构,通过Trie可以很快地查询自己想要找的单词是否在单词集合中,或者如本题中的含有某相同前缀的单词个数。此处的前缀指的是单词“abc”,那么"a","ab","abc"都是它的前缀。

Trie树的建立有两种方法,一种是链表的形式,一种是双数组形式,前者理解起来相对简单,但是空间占用较大,后者是理解起来复杂,暂时还没有搞懂,网上都是在说有限自动机的,后面会进一步搞懂他。

Trie树每个节点表示一个字母,且有26个子节点。原理很简单:树的每一层都对应字符串的一个位置。

此题一开始的思路有问题,应该集中思考问题——包含前缀的单词个数。如果仔细想得话,会发现Trie树在建立的时候,在所输入的所有单词中单词前缀重复的部分会被遍历很多次,所以如果用一个数据记录遍历的次数,就能知道结果。所以,“abc”中的c对应的遍历次数,就是以它为前缀的所有单词的个数。

#include<string.h>
#include<stdio.h>



class TrieNode{
public:
	TrieNode(): flag(0){
		for(int i=0;i<26;i++){
			pArry[i]=NULL;
		}
	}

public:
	int flag;
	TrieNode *pArry[26];
};


void insert(char tar[], int len, TrieNode *root){
	for(int i=0;i<len;i++){
		TrieNode* &p=root->pArry[tar[i]-'a'];
		if(p==NULL)
			p=new TrieNode;
		root=p;
		root->flag+=1;
	}
	return ;
}

int find(char tar[], int len, TrieNode *root){
	for(int i=0;i<len;i++){
		if(root->pArry[tar[i]-'a']==NULL)
			return 0;
		root=root->pArry[tar[i]-'a'];
	}
	return root->flag;
}



int main()
{
	int N,M;
	TrieNode *root=new TrieNode;
	char input[11];

	scanf("%d",&N);
	for(int i=0;i<N;i++){
		scanf("%s",input);
		insert(input,strlen(input),root);
	}

	scanf("%d",&M);
	for(int i=0;i<M;i++){
		scanf("%s",input);
		
		printf("%d\n",find(input,strlen(input),root));
		
	}
	
	return 0;
}


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章