作者:baiziyu
關於hanlp的文章已經分享過很多,似乎好像大部分以理論性的居多。最近有在整理一些hanlp應用項目中的文章,待整理完成後會陸續分享出來。本篇分享的依然是由baiziyu 分享的一篇文章,感興趣的可以在知乎上關注下他的專欄,寫的還是挺好的!
以下爲文章的主要內容:
自定義詞表的修改
自定義詞表在“pyhanlp\static\data\dictionary\custom”路徑下的“CustomDictionary.txt”文件中,HanLP.segment支持自定義此詞表。如果需要修改自定義詞表,則直接編輯文件“CustomDictionary.txt”,之後刪除路徑下的“CustomDictionary.txt.bin”,運行分詞代碼後即可自動生效。
驗證修改是否生效
驗證代碼
from pyhanlp import *
term_list = HanLP.segment(text)