HanLP 1.7.3 發佈了。HanLP 是由一系列模型與算法組成的 Java 工具包,目標是普及自然語言處理在生產環境中的應用。HanLP 具備功能完善、性能高效、架構清晰、語料時新、可自定義的特點。 在提供豐富功能的同時,HanLP 內部模塊堅持低耦合、模型堅持惰性加載、服務堅持靜態提供、詞典堅持明文發佈,使用非常方便,同時自帶一些語料處理工具,幫助用戶訓練自己的模型。
新版更新內容:
1.感知機詞法分析器默認使用98年人民日報6個月的大模型
2.優化DoubleArrayTrie fix #1136
3.防止ViterbiSegment.dat不必要的初始化
4.修復詞法分析器對動態插入的詞條的處理 fix #271 (comment)
5.詞法分析器seg接口支持自定義詞性覆蓋統計詞性 fix #1156
6.修訂拼音
7.新數據包data-for-1.7.3.zip md5=4e4f3695565a75b56427ba4a40731949
8.Portable版同步升級到v1.7.3
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.7.3</version>
</dependency>