開一文記錄和總結stata的學習,不斷更新中~
轉載請聯繫授權,並註明來源~
histogram 直方圖
【histogram varname [if] [in] [weight] [,[continuous_opts| discrete_opts] options】
varname:只能有一個變量呀~
histogram=hist
常用指令:hist varname/ hist varname,freq/ hist varname,bu(varname2)
y軸統計量:
1.density (stata默認的)
2.fraction=frac
3.frequency=freq
4.percent
(實例:此處hist varname)
A.直方圖可以設定寬度\開始值\直方組數
如圖:1:連續變量 2:離散變量
B.添加density plots(可以擬合數據的分佈)
(實例:)
Graph box/hbox 箱線圖
【graph box yvars [if] [in] [weight] [,options]】
【graph hbox yvars [if] [in] [weight] [,options]】
說明
1.直觀明瞭地識別數據批中的異常值
箱線圖判斷異常值的標準以四分位數和四分位距爲基礎,四分位數具有一定的耐抗性,多達25%的數據可以變得任意遠而不會很大地擾動四分位數,所以異常值不會影響箱形圖的數據形狀,箱線圖識別異常值的結果比較客觀。
2.利用箱線圖判斷數據批的偏態和尾重
對於標準正態分佈的樣本,只有極少值爲異常值。異常值越多說明尾部越重,自由度越小(即自由變動的量的個數);
而偏態表示偏離程度,異常值集中在較小值一側,則分佈呈左偏態;異常值集中在較大值一側,則分佈呈右偏態。
3.利用箱線圖比較幾批數據的形狀
圖解
異常值:離羣值,超過上下限的值,被定義爲小於Q1-1.5IQR或大於Q3+1.5IQR的值。
IQR:上四分位-下四分位
(實例如下圖,box/hbox)
Vioplot 小提琴圖
顯示數據分佈及其概率密度
注:stata中未自帶需要安裝
安裝:【ssc install vioplot】
【vioplot varlist [if] [in] [weight] [,option] 】