R語言入門(一)
R語言是一門用於統計分析、繪圖的語言。它是開源的。其功能並不遜色與matlab,當然這要取決於其使用的環境啦。
本人學習目標:學習R語言主要是爲了做數據挖掘和統計分析用的。
學習R語言參考的書籍主要是R語言實戰,和一些網絡上查詢的資料。
做爲第一部分,先介紹下R語言的工作環境。
Part1 R語言的安裝
這個就請自行谷歌或百度了,介於谷歌被河蟹了,可以使用自由門訪問。
Part2 R語言的工作環境
R語言的工作環境如下:
和matlab的界面差距有點大,但是這不是重點啦。
首先看到的就是一個控制檯,其上面的部分暫且不管,學習本着遇到不懂的再解決的原則,等需要了解的時候再介紹啦。
1 新手上路
我們先快速體驗一下R語言的功能先。
我們有6個人年齡與收入的數據(虛擬的)如下:
年齡 | 收入 |
---|---|
25 | 5000 |
21 | 3500 |
23 | 4500 |
27 | 4600 |
23 | 3800 |
25 | 4400 |
數據有了,我們需要對數據進行處理了。哦,對了,這裏要強調一下R語言與其他語言的賦值語句並不太一樣,它採用x <- 5,或者5 -> x的方式將5賦值給變量x,當然也可以採用=號賦值方式,但是不推薦。
我們處理數據可以使用函數c()以向量的方式輸入年齡和工資。然後使用mean()函數、sd()函數、cor()函數分別求出平均值、標準差、相關度。使用plot()函數繪製相關的散點圖。
具體代碼如下
>age<-(25,21,23,27,23,25)
>income<-c(5000,3500,4500,4600,3800,4400)
>mean(income)
[1] 4300
> sd(income)
[1] 551.362
> cor(age,income)
[1] 0.7608859
> plot(age,income)
所繪製的散點圖如下所示:
這裏含義都比較清晰就不解釋了。
2 工作空間
目前覺得比較重要的幾個函數是:
getwd()顯示當前工作的目錄
setwd(“directory”)修改當前的工作目錄爲directory
需要注意的是:setwd()命令的路徑使用的是正斜槓(/),R語言將反斜槓()做爲一個轉義符,所以即使在Windows平臺上運行R,在路徑中也要使用正斜槓。
3 輸入和輸出
從腳本中導入命令和將文本、圖形輸出的比較重要的幾個函數如下:
source(“filename”)可以在當前會話中執行一個腳本
sink(“filename”)將輸出重定向到文件filename中。
用於保存圖形輸出的有如下:
函數 | 輸出 |
---|---|
pdf(“filename.pdf”) | PDF文件 |
png(“filename.png”) | PNG文件 |
jpeg(“filename.jpeg”) | JPEG文件 |
bmp(“filename.bmp”) | BMP文件 |