使用Java調用中科院分詞NLPIR/ICTCLAS

官方地址:http://ictclas.nlpir.org/

 

1.       下載NLPIR/ICTCLAS2015分詞(最新版本)地址:http://ictclas.nlpir.org/newsdownloads?DocId=389

2.       下載NLPIR-ICTCLAS2013-Win-32-JNIu0416)地址:http://ictclas.nlpir.org/newsdownloads?DocId=354(我電腦是64win7,用的是32JDK32Eclipse,如果是64JDK要下載64位的)

3.       下載後將兩個壓縮包解壓

4.       創建Java工程

5.       20141230101836_ICTCLAS2015\ICTCLAS2015\bin\ICTCLAS2015中的NLPIR.dll文件複製到Java工程的跟目錄

6.       20130416090224_Win-32bit-JNI-lib\Win-32bit-JNI-lib\中的NLPIR_JNI.dll文件複製到Java工程的跟目錄

7.       再將20141230101836_ICTCLAS2015\ICTCLAS2015Data文件夾複製到Java工程的跟目錄

8.       20130416090224_Win-32bit-JNI-lib\Win-32bit-JNI-lib中的kevin文件夾TestNLPIR.java複製到Java工程src目錄下

9.       工程搭建完成,如圖

運行TestNLPIR.java,如果按上面的步驟配置可能會報錯了,查看日誌發現Configure.xml文件沒有找到(日誌文件在工程的跟目錄 yyyyMMdd.log,第一次執行需要按F5才能看見) 

修改TestNLPIR.java代碼31行,改成String argu = “”;即可,如果工程是UFT-8編碼,需要把所有的GB2312改成UFT-8,否者會亂碼 

 

修改後的代碼

 

修改後執行程序控制臺輸出:分詞結果爲:張華平/nr推出/v/ude1 NLPIR/x分詞/v系統/n/wd/d/qICTCLAS2013/x/wd新增/v新詞/n識別/vn/wn關鍵詞/n提取/v/wn/ag/ag分詞/v功能/n/wj _

 

但最後一個字符還是亂碼了,不知道爲什麼

 

錯誤及解決

1.Cannot Open Configure file

../../\Data\Configure.xml

找不到Configure.xml文件,修改TestNLPIR.java31

 

2. Not valid license or your license expired! Please feelfree to contact [email protected]!

    下載最新的NLPIR/ICTCLAS,用新的Data文件夾覆蓋舊的

發佈了52 篇原創文章 · 獲贊 12 · 訪問量 10萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章