官方地址:http://ictclas.nlpir.org/
1. 下載NLPIR/ICTCLAS2015分詞(最新版本)地址:http://ictclas.nlpir.org/newsdownloads?DocId=389
2. 下載NLPIR-ICTCLAS2013-Win-32-JNI(u0416)地址:http://ictclas.nlpir.org/newsdownloads?DocId=354(我電腦是64位win7,用的是32位JDK和32位Eclipse,如果是64位JDK要下載64位的)
3. 下載後將兩個壓縮包解壓
4. 創建Java工程
5. 20141230101836_ICTCLAS2015\ICTCLAS2015\bin\ICTCLAS2015中的NLPIR.dll文件複製到Java工程的跟目錄
6. 20130416090224_Win-32bit-JNI-lib\Win-32bit-JNI-lib\中的NLPIR_JNI.dll文件複製到Java工程的跟目錄
7. 再將20141230101836_ICTCLAS2015\ICTCLAS2015中Data文件夾複製到Java工程的跟目錄
8. 20130416090224_Win-32bit-JNI-lib\Win-32bit-JNI-lib中的kevin文件夾和TestNLPIR.java複製到Java工程src目錄下
9. 工程搭建完成,如圖
運行TestNLPIR.java,如果按上面的步驟配置可能會報錯了,查看日誌發現Configure.xml文件沒有找到(日誌文件在工程的跟目錄 yyyyMMdd.log,第一次執行需要按F5才能看見)
修改TestNLPIR.java代碼31行,改成String argu = “”;即可,如果工程是UFT-8編碼,需要把所有的GB2312改成UFT-8,否者會亂碼
修改後的代碼
修改後執行程序控制臺輸出:分詞結果爲:張華平/nr推出/v的/ude1 NLPIR/x分詞/v系統/n,/wd又/d名/qICTCLAS2013/x,/wd新增/v新詞/n識別/vn、/wn關鍵詞/n提取/v、/wn微/ag博/ag分詞/v功能/n。/wj _
但最後一個字符還是亂碼了,不知道爲什麼
錯誤及解決
1.Cannot Open Configure file
../../\Data\Configure.xml
找不到Configure.xml文件,修改TestNLPIR.java第31行
2. Not valid license or your license expired! Please feelfree to contact [email protected]!
下載最新的NLPIR/ICTCLAS,用新的Data文件夾覆蓋舊的