Hmisc包函數
1、upData(object, ...,subset, rename, drop, keep, labels, units, levels, force.single=TRUE,lowernames=FALSE, caplabels=FALSE, moveUnits=FALSE,charfactor=FALSE, print=TRUE, html=FALSE)函數
主要參數解釋:
subset相當於對於數據變量的篩選/條件判斷表達式;
rename批量名稱/變量名修改;
drop去掉數據中的哪些變量;
keep保留哪些變量名
2、csv.get 函數讀取csv文件
參數:vnames變量名所在行,labels變量標籤,skip需要跳過的行
csv.get('dataname.csv', vnames, labels, skip)
判斷對應數據是否在比較列中,返回邏輯值,x、y爲向量:x %nin% y
3、給變量做標籤/說明:valueLabel(var)
4、upFirst(txt, lower = FALSE, alllower = FALSE)
將每個單詞首字母變爲大寫,lower設置爲TRUE時僅將句子中首個單詞首字母變爲大寫alllower爲TRUE使得所有單詞字母爲小寫。
5、在R中運行系統命令函數:sys(command, text=NULL, output=TRUE)
6、描述數據集或者變量中數據情況的函數:describe(全面瞭解數據的缺失情況、唯一值、均值、最大最小值、值大小累計百分比分佈)
7、補充其他包中的函數
psych包中的describe.by函數是對於數據變量的描述性統計,有助於全面瞭解變量的值情況,且可以按照類別分組統計
pastecs包中stat.desc可以觀察數據的置信區間、正態分佈統計量等