nlp分詞之pkuseg

北大的分詞工具
(1)多領域分詞。新聞、科研、網絡、醫藥、旅遊、金融、工業。
(2)更高的分詞準確率
(3)支持用戶自訓練模型,支持用戶使用全新的標註數據進行訓練。
如果PyPI官方源下載速度不理想建議使用鏡像源,比如
初次安裝:
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple pkuseg
醫藥領域的模型下載地址:
https://github.com/lancopku/pkuseg-python/releases/download/v0.0.16/medicine.zip" to C:\Users\fangb/.pkuseg
手動下載zip文件 https://github.com/lancopku/pkuseg-python/releases

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章