自然語言處理工具hanlp定製用戶詞條


作者:baiziyu

關於hanlp的文章已經分享過很多,似乎好像大部分以理論性的居多。最近有在整理一些hanlp應用項目中的文章,待整理完成後會陸續分享出來。本篇分享的依然是由baiziyu 分享的一篇文章,感興趣的可以在知乎上關注下他的專欄,寫的還是挺好的!

以下爲文章的主要內容:

自定義詞表的修改

自定義詞表在“pyhanlp\static\data\dictionary\custom”路徑下的“CustomDictionary.txt”文件中,HanLP.segment支持自定義此詞表。如果需要修改自定義詞表,則直接編輯文件“CustomDictionary.txt”,之後刪除路徑下的“CustomDictionary.txt.bin”,運行分詞代碼後即可自動生效。

驗證修改是否生效

圖1.jpg

圖2.jpg

驗證代碼

from pyhanlp import *

term_list = HanLP.segment(text)


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章