樹——Trie前綴樹

  術語trie取自retrieval,也被稱爲數字樹、字典樹或前綴樹,是一種有序樹數據結構,哈希樹的變種。

與二叉查找樹不同,樹中節點不存儲與節點關聯的鍵,而是通過樹中的位置定義鍵。一個節點的所有子孫節點擁有與該節點相同的字符串前綴,根節點與空字符串相關聯。並不是每個節點都與值關聯,僅葉節點和部分內部節點與值關聯。


trie 中的鍵通常是字符串,但也可以是其它的結構。trie 的算法可以很容易地修改爲處理其它結構的有序序列,比如一串數字或者形狀的排列。比如,bitwise trie 中的鍵是一串位元,可以用於表示整數或者內存地址。

性質


  • 根節點不包含字符,除根節點外每一個節點都只包含一個字符;

  • 從根節點到某一節點,路徑上經過的字符連接起來,爲該節點對應的字符串;

  • 每個節點的所有子節點包含的字符都不相同。

應用


替代其他數據結構

trie較二叉查找樹有很多優點,trie可用於替代哈希表,優點如下:

  • trie數據查找與不完美哈希表(鏈表實現,完美哈希表爲數組實現)在最差情況下更快:對於trie,最差情況爲O(m),m爲查找字符串的長度; 對於不完美哈希表,會有鍵衝突(不同鍵哈希相同),最差情況爲O(N),N爲全部字符產集合個數。典型情況下是O(m)用於哈希計算、O(1)用於數據查找。

  • trie中不同鍵沒有衝突

  • trie的桶與哈希表用於存儲鍵衝突的桶類似,僅在單個鍵與多個值關聯時需要

  • 當更多的鍵加入trie,無需提供哈希方法或改變哈希方法

  • tire通過鍵爲條目提供了字母順序

Trie也有一些缺點:

  • trie數據查找在某些情況下(尤其當數據直接從磁盤或隨機訪問時間遠遠高於主內存的輔助存儲設備時)比哈希錶慢

  • 當鍵爲某些類型時(例如浮點數)之類的鍵,前綴鏈很長且前綴不是特別有意義。然而bitwise trie能夠處理標註IEEE單精度和雙精度浮點數。

  • 一些trie會比哈希表消耗更多空間:對於trie,每個字符串的每個字符都可能需要分配內存;對於大多數哈希表,爲整個條目分配一塊內存。

字典表示

典型應用是預測文本排序(常被搜索引擎系統用於文本詞頻統計)、字典自動完成、字符串近似匹配(拼寫檢查、斷字)。



案例:

#1014 : Trie樹

時間限制:10000ms

單點時限:1000ms

內存限制:256MB

描述

小Hi和小Ho是一對好朋友,出生在信息化社會的他們對編程產生了莫大的興趣,他們約定好互相幫助,在編程的學習道路上一同前進。

這一天,他們遇到了一本詞典,於是小Hi就向小Ho提出了那個經典的問題:“小Ho,你能不能對於每一個我給出的字符串,都在這個詞典裏面找到以這個字符串開頭的所有單詞呢?

身經百戰的小Ho答道:“怎麼會不能呢!你每給我一個字符串,我就依次遍歷詞典裏的所有單詞,檢查你給我的字符串是不是這個單詞的前綴不就是了?

小Hi笑道:“你啊,還是太年輕了!~假設這本詞典裏有10萬個單詞,我詢問你一萬次,你得要算到哪年哪月去?”

小Ho低頭算了一算,看着那一堆堆的0,頓時感覺自己這輩子都要花在上面了...

小Hi看着小Ho的囧樣,也是繼續笑道:“讓我來提高一下你的知識水平吧~你知道樹這樣一種數據結構麼?”

小Ho想了想,說道:“知道~它是一種基礎的數據結構,就像這裏說的一樣!”

小Hi滿意的點了點頭,說道:“那你知道我怎麼樣用一棵樹來表示整個詞典麼?”

小Ho搖搖頭表示自己不清楚。

提示一:Trie樹的建立

“你看,我們現在得到了這樣一棵樹,那麼你看,如果我給你一個字符串ap,你要怎麼找到所有以ap開頭的單詞呢?”小Hi又開始考校小Ho。

“唔...一個個遍歷所有的單詞?”小Ho還是不忘自己最開始提出來的算法。

“笨!這棵樹難道就白構建了!”小Hi教訓完小Ho,繼續道:“看好了!”

提示二:如何使用Trie樹

提示三:在建立Trie樹時同時進行統計!

“那麼現在!趕緊去用代碼實現吧!”小Hi如是說道

輸入

輸入的第一行爲一個正整數n,表示詞典的大小,其後n行,每一行一個單詞(不保證是英文單詞,也有可能是火星文單詞哦),單詞由不超過10個的小寫英文字母組成,可能存在相同的單詞,此時應將其視作不同的單詞。接下來的一行爲一個正整數m,表示小Hi詢問的次數,其後m行,每一行一個字符串,該字符串由不超過10個的小寫英文字母組成,表示小Hi的一個詢問。

在20%的數據中n, m<=10,詞典的字母表大小<=2.

在60%的數據中n, m<=1000,詞典的字母表大小<=5.

在100%的數據中n, m<=100000,詞典的字母表大小<=26.

本題按通過的數據量排名哦~

輸出

對於小Hi的每一個詢問,輸出一個整數Ans,表示詞典中以小Hi給出的字符串爲前綴的單詞的個數。

  • 樣例輸入

  • 5
    babaab
    babbbaaaa
    abba
    aaaaabaa
    babaababb
    5
    babb
    baabaaa
    bab
    bb
    bbabbaab
  • 樣例輸出

  • 1
    0
    3
    0
    0


AC代碼:

#include<iostream>

#include<algorithm>

#include<string>

#include<cstdio>

#include<cmath>

#include<queue>

#include<map>

#include<stack>

#include<vector>

using namespace std;


struct TNode {

int count;

TNode *next[26];

TNode() :count(0){

for (int i = 0; i < 26; i++)

next[i] = NULL;

}

};


class TTree {

public:

TTree() {

root = new TNode();

}

~TTree() {

destory(root);

}

void insert(const char *s);

int find(const char *s);

void destory(TNode *r);

private:

TNode *root;

};


void TTree::insert(const char *s) {

TNode *r = root;

while (*s) {

if (!r->next[*s - 'a'])

{

TNode *t = new TNode();

r->next[*s - 'a'] = t;

}

r->count++;

r = r->next[*s - 'a'];

s++;

}

r->count++;

}


int TTree::find(const char *s) {

TNode *r = root;

while (*s) {

if (!r->next[*s - 'a'])

return 0;

r = r->next[*s - 'a'];

s++;

}

return r->count;

}


void TTree::destory(TNode *r) {

for (int i = 0; i < 26; i++)

{

if (r->next[i] != NULL)

destory(r->next[i]);

}

delete r;

r = NULL;

}


int main()

{

string s;

int n;

int m;

TTree T;

cin >> n;

for (int i = 0; i < n; i++) {

cin >> s;

T.insert(s.c_str());

}

cin >> m;

for (int i = 0; i < m; i++)

{

cin >> s;

cout << T.find(s.c_str()) << endl;

}

return 0;

}


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章