plyr包的基本函數:
**主函數:ply() 函數族
aaply()函數、adply()函數、alply()函數、daply()函數、ddply()函數、dlply()函數、mply()函數
按輸入分類,:分爲aply(), dply(), lply()三大類:
aply(.data, .margins, .fun, …, .progress = “none”)
dply(.data, .variables, .fun, …, .progress = “none”)
lply(.data, .fun, …, .progress = “none”)
參數:.data是要進行處理的數組
.margins是用哪種方式去切割數據,取值爲1,2,c(1,2)
.fun是對切割的數據指定一個函數進行處理
.progress決定是否顯示及用哪種方式顯示進度條
.variables指定要按其分割的變量名稱
按輸出格式來分類:分爲aply()、dply()、lply()、_ply()
mply(.data,.fun=NULL,.inform=FALSE,…)
把array或者dataframe的參數數值放進函數中,得到dataframe(mdply),array(maply)或者list(mlply)
install.packages(“plyr”)
#對每列求均值(aply()函數)
library(plyr)
a=matrix(1:21,nrow=3,ncol=7)
b=aaply(a,.margins=2,.fun=mean)
aaply(a,2,.fun=mean)
aaply(a,1,mean,.progress=“text”)
#按變量分組求均值(dply()函數)
names=c(“John”,“Mary”,“Alice”,“Peter”,“Roger”,“Phyillis”)
age