R數據加工廠-plyr包

plyr包的基本函數:
**主函數:ply() 函數族
aaply()函數、adply()函數、alply()函數、daply()函數、ddply()函數、dlply()函數、mply()函數
按輸入分類,:分爲a
ply(), dply(), lply()三大類:
aply(.data, .margins, .fun, …, .progress = “none”)
d
ply(.data, .variables, .fun, …, .progress = “none”)
lply(.data, .fun, …, .progress = “none”)
參數:.data是要進行處理的數組
.margins是用哪種方式去切割數據,取值爲1,2,c(1,2)
.fun是對切割的數據指定一個函數進行處理
.progress決定是否顯示及用哪種方式顯示進度條
.variables指定要按其分割的變量名稱
按輸出格式來分類:分爲
aply()、dply()、lply()、_ply()
m
ply(.data,.fun=NULL,.inform=FALSE,…)
把array或者dataframe的參數數值放進函數中,得到dataframe(mdply),array(maply)或者list(mlply)
install.packages(“plyr”)

#對每列求均值(aply()函數)
library(plyr)
a=matrix(1:21,nrow=3,ncol=7)
b=aaply(a,.margins=2,.fun=mean)
aaply(a,2,.fun=mean)
aaply(a,1,mean,.progress=“text”)
#按變量分組求均值(d
ply()函數)
names=c(“John”,“Mary”,“Alice”,“Peter”,“Roger”,“Phyillis”)
age

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章