hanlp,jieba,nlpir分詞工具安裝報錯完全解決方案

hanlp問題分析及解決方案

windows環境分析

github地址
可以看到setup.py最下方兩行安裝環境要求
hanlp setup.py
1.最重要的python環境要求,python>=3.6,如果不滿足,那需要升級python。
2.首先因爲Hanlp原來是Java的一個jar包,只是後來被引進到python中,因此JDK環境是必不可少的。
3.micrsoft c++ 14.0,該組件是很多軟件的運行庫,包括一些遊戲,需要安裝。
4.fasttext==0.9.1,筆者在安裝過程中要到了該錯誤,一會單獨安裝。
5、最新的hanlp2.0版本要求tensorflow=2.1.0版本,這裏如果網速有問題,應該單獨安裝。

解決方案

1.由於筆者本機已安裝過java jdk1.8.0_202版本,這裏就不再贅述jdk的安裝過程了。
【基本上就是下載安裝->更改環境變量->打開命令框,輸入java與javac命令有輸出,不報錯,則證明安裝成功->你也可以通過java -version查看已安裝java的版本,實在不會,就去百度一下】
2.micrsoft c++ 14.0安裝,你可以去Microsoft 官網下載;如果你不想去官網下,可以從這裏下載-提取碼:zjno
安裝過程,直接默認安裝,路徑可以更改,還有很多附加功能,可以不安裝。
3.fasttext安裝,這是一個詞向量工具,也能做簡單的文本分類,通過如下命令安裝。

pip3 install fasttext==0.9.1 -i https://pypi.tuna.tsinghua.edu.cn/simple 

4.windows下安裝該環境,最好使用Anaconda3,由於hanlp可以使用GPU/TPU,因此最好安裝gpu版本tensorflow-gpu=2.1.0,安裝命令如下

conda install tensorflow==2.1.0

安裝完成後,測試代碼如下:

import tensorflow as tf
print(tf.__version__)

如果沒有報錯,萬事大吉;
如果報錯:
情況一:
tensorflow2.1.0報錯
需要卸載numpy,或者升級numpy:

pip3 install –U numpy

情況二:
報錯爲tensorflow自身的問題,很遺憾需要卸載,重裝。

conda uninstall tensorflow==2.1.0
conda install tensorflow==2.1.0

5.最終安裝完成這些基礎環境之後,安裝hanlp

pip3 install hanlp

jieba問題分析及解決方案

問題分析

可以看到github上提出的環境要求
jieba paddle
如果報錯,基本是使用了Paddle,但是沒有安裝paddle且沒有升級jieba。

解決方案

pip install paddlepaddle-tiny==1.6.1
pip3 install -U jieba

nlpir問題分析及解決方案

問題分析

一般是授權問題,pip安裝的是舊一些的版本。由於授權過期的問題,需要重新授權。

解決方案

windows(win7 x64)

去其github網站下載源文件
NLPIRgithub
下載該文件,獲取授權。
NLPIR授權
將其複製到其安裝目錄,筆者使用anconda安裝,目錄如下
NLPIR安裝目錄
直接將其複製過來,解決問題。

linux(ubuntu16.04.0 x64)

與windows下解決方法類似
但是可以使用

git clone git@github.com:NLPIR-team/NLPIR.git

同樣的方法
查看已安裝環境的路徑
在這裏插入圖片描述
替換NLPIR.user

cp 你的下載路徑/NLPIR-master/License/license for a month/NLPIR-ICTCLAS分詞系統授權/NLPIR.user 你的安裝路徑/anaconda3/envs/experiment/lib/python3.6/site-packages/pynlpir/Data/

好了,問題至此應該解決了。

參考博文

[1]https://www.cnblogs.com/pythoner6833/p/10108964.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章