nlp分词之pkuseg

北大的分词工具
(1)多领域分词。新闻、科研、网络、医药、旅游、金融、工业。
(2)更高的分词准确率
(3)支持用户自训练模型,支持用户使用全新的标注数据进行训练。
如果PyPI官方源下载速度不理想建议使用镜像源,比如
初次安装:
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple pkuseg
医药领域的模型下载地址:
https://github.com/lancopku/pkuseg-python/releases/download/v0.0.16/medicine.zip" to C:\Users\fangb/.pkuseg
手动下载zip文件 https://github.com/lancopku/pkuseg-python/releases

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章