Part1 安裝依賴包
(關於32位和64位的問題在原文基礎上做了些改動)
R語言中中文分析的軟件包是Rwordseg,Rwordseg軟件包依賴rJava包,rJava需要本機中有安裝Java。
第一步:安裝Java,請安裝JDK,JRE不行。請對應機型,下載安裝JDK。
下載地址:
http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
查看JAVA是否安裝成功,運行cmd,輸入java –version,如果能正常顯示你的Java版本則安裝正確。如下圖:
第二步:安裝R
R的下載地址:http://cran.rstudio.com/
RStudio的下載地址:http://www.rstudio.com/products/rstudio/#Desk
重點:一般在安裝R的時候可以選擇32位或者64位的,儘量都安裝
第三步:安裝rJava,這個直接在R或者RStudio裏面安裝軟件包就行了。如果是剛安裝完java記得重啓你的R或者RStudio。
直接輸入命令安裝:Install.packages(“rJava”);或下載R包,手動tools>install packages安裝。
加載rJava包,library(“rJava”),沒提示錯誤則rJava安裝成功。
第三步是安裝Rwordseg。
RStudio,請設置爲32位,設置方法,工具欄Tools > Global Options > General,R version,改成32-bit。
Rwordseg項目目前發佈在R-forge上,所以不能直接在R或者Rstudio中用安裝軟件包功能。
Rwordseg包下載地址:http://R-Forge.R-project.org/bin/windows/contrib/3.0/Rwordseg_0.2-1.zip
後來嘗試把軟件包下載到本地後,從本地安裝,tools>install packages,選擇從本地zip文件安裝軟件包。
或者以下方法安裝:
在最新版本的R下可以直接安裝:
如果是舊版本的R,可以通過source的方式進行安裝:
RStudio設置成64位,重啓RStudio
嘗試使用Rwordseg,如下一個簡單的例子:
另外,該R包的中文文檔下載地址:http://download.csdn.net/detail/cl1143015961/8436741
該文檔中很詳細地說明了軟件包的功能,包括如何做分詞,如何添加刪除詞語,如何添加刪除字典,它支持的字典除了.dic格式之外,還有.scel(搜狗輸入法的詞庫)。搜狗輸入法的詞庫下載地址http://pinyin.sogou.com/dict/,選擇你自己需要的分類去做嘗試吧!