hanlp,jieba,nlpir分詞工具安裝報錯完全解決方案
hanlp問題分析及解決方案
windows環境分析
github地址
可以看到setup.py最下方兩行安裝環境要求
1.最重要的python環境要求,python>=3.6,如果不滿足,那需要升級python。
2.首先因爲Hanlp原來是Java的一個jar包,只是後來被引進到python中,因此JDK環境是必不可少的。
3.micrsoft c++ 14.0,該組件是很多軟件的運行庫,包括一些遊戲,需要安裝。
4.fasttext==0.9.1,筆者在安裝過程中要到了該錯誤,一會單獨安裝。
5、最新的hanlp2.0版本要求tensorflow=2.1.0版本,這裏如果網速有問題,應該單獨安裝。
解決方案
1.由於筆者本機已安裝過java jdk1.8.0_202版本,這裏就不再贅述jdk的安裝過程了。
【基本上就是下載安裝->更改環境變量->打開命令框,輸入java與javac命令有輸出,不報錯,則證明安裝成功->你也可以通過java -version查看已安裝java的版本,實在不會,就去百度一下】
2.micrsoft c++ 14.0安裝,你可以去Microsoft 官網下載;如果你不想去官網下,可以從這裏下載-提取碼:zjno
安裝過程,直接默認安裝,路徑可以更改,還有很多附加功能,可以不安裝。
3.fasttext安裝,這是一個詞向量工具,也能做簡單的文本分類,通過如下命令安裝。
pip3 install fasttext==0.9.1 -i https://pypi.tuna.tsinghua.edu.cn/simple
4.windows下安裝該環境,最好使用Anaconda3,由於hanlp可以使用GPU/TPU,因此最好安裝gpu版本tensorflow-gpu=2.1.0,安裝命令如下
conda install tensorflow==2.1.0
安裝完成後,測試代碼如下:
import tensorflow as tf
print(tf.__version__)
如果沒有報錯,萬事大吉;
如果報錯:
情況一:
需要卸載numpy,或者升級numpy:
pip3 install –U numpy
情況二:
報錯爲tensorflow自身的問題,很遺憾需要卸載,重裝。
conda uninstall tensorflow==2.1.0
conda install tensorflow==2.1.0
5.最終安裝完成這些基礎環境之後,安裝hanlp
pip3 install hanlp
jieba問題分析及解決方案
問題分析
可以看到github上提出的環境要求
如果報錯,基本是使用了Paddle,但是沒有安裝paddle且沒有升級jieba。
解決方案
pip install paddlepaddle-tiny==1.6.1
pip3 install -U jieba
nlpir問題分析及解決方案
問題分析
一般是授權問題,pip安裝的是舊一些的版本。由於授權過期的問題,需要重新授權。
解決方案
windows(win7 x64)
去其github網站下載源文件
下載該文件,獲取授權。
將其複製到其安裝目錄,筆者使用anconda安裝,目錄如下
直接將其複製過來,解決問題。
linux(ubuntu16.04.0 x64)
與windows下解決方法類似
但是可以使用
git clone git@github.com:NLPIR-team/NLPIR.git
同樣的方法
查看已安裝環境的路徑
替換NLPIR.user
cp 你的下載路徑/NLPIR-master/License/license for a month/NLPIR-ICTCLAS分詞系統授權/NLPIR.user 你的安裝路徑/anaconda3/envs/experiment/lib/python3.6/site-packages/pynlpir/Data/
好了,問題至此應該解決了。