R文本挖掘之一安裝R軟件和包

原文地址:CSDN-R語言做文本挖掘 Part1安裝依賴包


Part1 安裝依賴包

關於32位和64位的問題在原文基礎上做了些改動

R語言中中文分析的軟件包是Rwordseg,Rwordseg軟件包依賴rJava包,rJava需要本機中有安裝Java 

第一步:安裝Java,請安裝JDK,JRE不行。請對應機型,下載安裝JDK。

下載地址:

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

查看JAVA是否安裝成功,運行cmd,輸入java –version,如果能正常顯示你的Java版本則安裝正確。如下圖:


第二步:安裝R 

R的下載地址:http://cran.rstudio.com/

RStudio的下載地址:http://www.rstudio.com/products/rstudio/#Desk

重點:一般在安裝R的時候可以選擇32位或者64位的,儘量都安裝


第三步:安裝rJava,這個直接在R或者RStudio裏面安裝軟件包就行了。如果是剛安裝完java記得重啓你的R或者RStudio。

直接輸入命令安裝:Install.packages(“rJava”);或下載R包,手動tools>install packages安裝。

加載rJava包,library(“rJava”),沒提示錯誤則rJava安裝成功。

 

第三步是安裝Rwordseg。

RStudio,請設置爲32位,設置方法,工具欄Tools > Global Options > General,R version,改成32-bit。


Rwordseg項目目前發佈在R-forge上,所以不能直接在R或者Rstudio中用安裝軟件包功能。

Rwordseg包下載地址:http://R-Forge.R-project.org/bin/windows/contrib/3.0/Rwordseg_0.2-1.zip

後來嘗試把軟件包下載到本地後,從本地安裝,tools>install packages,選擇從本地zip文件安裝軟件包

或者以下方法安裝:

在最新版本的R下可以直接安裝:

[plain] view plain copy
 在CODE上查看代碼片派生到我的代碼片
  1. install.packages("Rwordseg", repos = "http://R-Forge.R-project.org")  

如果是舊版本的R,可以通過source的方式進行安裝:

[plain] view plain copy
 在CODE上查看代碼片派生到我的代碼片
  1. install.packages("Rwordseg", repos = "http://R-Forge.R-project.org", type = "source")  
RStudio設置成64位,重啓RStudio

嘗試使用Rwordseg,如下一個簡單的例子:

[plain] view plain copy
 在CODE上查看代碼片派生到我的代碼片
  1. library(Rwordseg)  
  2. segmentCN(c("生命在於運動", "生活處處皆風景"))  
  3. [[1]]  
  4. [1] "生命" "在於" "運動"  
  5. [[2]]  
  6. [1] "生活" "處處" "皆"   "風景"  
另外,該R包的中文文檔下載地址:http://download.csdn.net/detail/cl1143015961/8436741

該文檔中很詳細地說明了軟件包的功能,包括如何做分詞,如何添加刪除詞語,如何添加刪除字典,它支持的字典除了.dic格式之外,還有.scel(搜狗輸入法的詞庫)。搜狗輸入法的詞庫下載地址http://pinyin.sogou.com/dict/,選擇你自己需要的分類去做嘗試吧!

發佈了17 篇原創文章 · 獲贊 14 · 訪問量 10萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章