正向最大匹配分詞,怎麼做最快?

 用所有詞生成一個字典樹,匹配的過程就是查字典的過程。
假設我們有兩個詞”百度“,”百家姓“,那麼生成的字典樹就是:

百---度*
|
|-----家----姓*

其中“度”和“姓”旁邊的星號表示這是一個有效詞。
對於句子“百度面試題“,首先在字典中找”百“,找到了;繼續向下查找”度“,又找到了;繼續向下查找”面“,沒有找到。那麼”百度“就是我們分出來的第一個詞。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章