轉發自:http://blog.sina.com.cn/s/blog_dc3dfe290102uwux.html
張華平老師更新了ictclass的最新版(已更名爲nlpir),我前一篇博客提供的接口便用不上了,這裏更新一下新版nlpir的python接口實現。
對於ictclass的介紹,詳細見 http://ictclas.nlpir.org/ ,這裏就不多介紹,直接進入主題。
1. 下載並配置SWIG
使用python調用c++庫,需要利用SWIG,官方地址:
下載解壓後,爲了能夠在命令行中使用swig命令,需要將對應文件夾路徑加入windows的環境變量。
在命令行中輸入swig,如果出現“Must specify an input file. Use -help for available options.”則表示一切順利。
2. 下載NLPIR
地址: http://ictclas.nlpir.org/downloads
解壓下載的壓縮文件,新建文件夾nlpir,將解壓後的以下內容複製到nlpir文件夾下:
Data文件夾以及其中所有文件,bin文件夾下的NLPIR.dll,lib文件夾下的NLPIR.lib,以及include文件夾下的NLPIR.h 。
3. 下載自動化生成python接口所需的文件
地址: http://vdisk.weibo.com/s/GxhrY
解壓後將其中所有文件拷到剛纔新建的nlpir文件夾下。
雙擊運行setup.bat 。
如果上述步驟都正常完成,將nlpir文件夾拷到python安裝目錄下的lib\site-packages目錄下。
現在就可以再python shell 中測試nlpir了。
>>> from nlpir.NLPIRSeg import * >>> nlpseg = NLPIRSeg() NLPIR initialized properly >>> print nlpseg.sentSeg("python 是一門非常簡潔漂亮的編程語言") python 是 一 門 非常 簡潔 漂亮 的 編程 語言 >>> print nlpseg.sentPos("python 是一門非常簡潔漂亮的編程語言") python/x 是/vshi 一/m 門/q 非常/d 簡潔/a 漂亮/a 的/ude1 編程/vn 語言/n >>>
其中可能遇到問題:Unable to find vcvarsall.bat
問題原因:windows Python2.7本身就是VS2008編譯的,但電腦上安裝的版本可能不是2008
解決辦法:添加"VS90COMNTOOLS"指向自己安裝的VS環境,例如C:\Program Files\Microsoft Visual Studio 10.0\Common7\Tools\。