Windows下安裝哈工大自然語言處理模型LTP

做文本處理的時候會用到哈工大LTP(Language Technology Platform),但是在Windows下python安裝pyltp模塊的時候遇到不少坑。首先放出LTP的依賴支持情況。來自 https://github.com/hit-scir/pyltp

可以看出在Windows下LTP不支持Python 3.7,目前只支持Python3.5和Python3.6。

在嘗試過程中的問題歸納如下:

嘗試1pip install pyltp 很慢,後來改用豆瓣源安裝 pip install pyltp -i https://pypi.douban.com/simple 。安裝很快但是執行build的時候報錯 “Microsoft Visual C++ 14.0 is required ... ” 提示的意思就是缺少依賴。

嘗試2:求助 https://pypi.org/project/pyltp/ ,裏面介紹了另外一種源碼安裝方式

$ git clone https://github.com/HIT-SCIR/pyltp 

$ git submodule init

$ git submodule update

$ python setup.py install      # Mac系統出現版本問題使用 MACOSX_DEPLOYMENT_TARGET=10.7 python setup.py install

這裏要藉助Git工具,在git bash命令行裏輸入按步驟輸入以上命令。第三步執行很慢,執行到最後一步install的時候又報錯

“Microsoft Visual C++ 14.0 is required ... ”

嘗試3: 以上兩種情形都需要先安裝Microsoft Visual Studio(Microsoft BuildTools 2015無用)。苦於這個IDE太大,選擇放棄。如果想避開安裝 Microsoft VS, 從網友那得知有編譯好的wheel文件可以通過pip install 的方式安裝,但是隻有適配 python3.5 和 python 3.6 的版本,即 pyltp-0.2.1-cp35-cp35m-win_amd64.whl 和 pyltp-0.2.1-cp36-cp36m-win_amd64.whl(詳見 https://blog.csdn.net/shuihupo/article/details/81545335)。

本人電腦上是python 3.7,不想降級,於是藉助Anaconda安裝了python3.6,在Anaconda Prompt命令行窗口中敲入:

pip install pyltp

這樣pyltp庫就安裝到Anaconda下的Python3.6環境下,安裝成功,版本爲最新的0.2.1。

關於LTP模型的下載及測試安裝成功也與否也請參考 https://blog.csdn.net/shuihupo/article/details/81545335

這樣,在Pycharm中編寫代碼調用pyltp的時候,可以配置項目文件夾的Interpreter爲Anaconda環境下的python3.6環境。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章