R語言入門(一)

R語言入門(一)

R語言是一門用於統計分析、繪圖的語言。它是開源的。其功能並不遜色與matlab,當然這要取決於其使用的環境啦。

本人學習目標:學習R語言主要是爲了做數據挖掘和統計分析用的。

學習R語言參考的書籍主要是R語言實戰,和一些網絡上查詢的資料。

做爲第一部分,先介紹下R語言的工作環境。

Part1 R語言的安裝

這個就請自行谷歌或百度了,介於谷歌被河蟹了,可以使用自由門訪問。

Part2 R語言的工作環境

R語言的工作環境如下:
這裏寫圖片描述
和matlab的界面差距有點大,但是這不是重點啦。
首先看到的就是一個控制檯,其上面的部分暫且不管,學習本着遇到不懂的再解決的原則,等需要了解的時候再介紹啦。

1 新手上路

我們先快速體驗一下R語言的功能先。
我們有6個人年齡與收入的數據(虛擬的)如下:

年齡 收入
25 5000
21 3500
23 4500
27 4600
23 3800
25 4400

數據有了,我們需要對數據進行處理了。哦,對了,這裏要強調一下R語言與其他語言的賦值語句並不太一樣,它採用x <- 5,或者5 -> x的方式將5賦值給變量x,當然也可以採用=號賦值方式,但是不推薦。
我們處理數據可以使用函數c()以向量的方式輸入年齡和工資。然後使用mean()函數、sd()函數、cor()函數分別求出平均值、標準差、相關度。使用plot()函數繪製相關的散點圖。
具體代碼如下

>age<-(25,21,23,27,23,25)
>income<-c(5000,3500,4500,4600,3800,4400)
>mean(income)
[1] 4300
> sd(income)
[1] 551.362
> cor(age,income)
[1] 0.7608859
> plot(age,income)

所繪製的散點圖如下所示:
這裏寫圖片描述
這裏含義都比較清晰就不解釋了。

2 工作空間

目前覺得比較重要的幾個函數是:
getwd()顯示當前工作的目錄
setwd(“directory”)修改當前的工作目錄爲directory
需要注意的是:setwd()命令的路徑使用的是正斜槓(/),R語言將反斜槓()做爲一個轉義符,所以即使在Windows平臺上運行R,在路徑中也要使用正斜槓。

3 輸入和輸出

從腳本中導入命令和將文本、圖形輸出的比較重要的幾個函數如下:
source(“filename”)可以在當前會話中執行一個腳本
sink(“filename”)將輸出重定向到文件filename中。
用於保存圖形輸出的有如下:

函數 輸出
pdf(“filename.pdf”) PDF文件
png(“filename.png”) PNG文件
jpeg(“filename.jpeg”) JPEG文件
bmp(“filename.bmp”) BMP文件
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章