【stata】統計圖——學習教程全記錄(02)

開一文記錄和總結stata的學習,不斷更新中~

轉載請聯繫授權,並註明來源~

histogram 直方圖

【histogram varname [if] [in] [weight] [,[continuous_opts| discrete_opts] options】

varname:只能有一個變量呀~

histogram=hist

常用指令:hist varname/  hist varname,freq/  hist varname,bu(varname2)

y軸統計量:

1.density   (stata默認的)

2.fraction=frac

3.frequency=freq

4.percent

(實例:此處hist varname)

A.直方圖可以設定寬度\開始值\直方組數

如圖:1:連續變量  2:離散變量 

B.添加density plots(可以擬合數據的分佈)

(實例:

 

Graph box/hbox 箱線圖

【graph box yvars [if] [in] [weight] [,options]】

【graph hbox yvars [if] [in] [weight] [,options]】

說明

1.直觀明瞭地識別數據批中的異常值

箱線圖判斷異常值的標準以四分位數和四分位距爲基礎,四分位數具有一定的耐抗性,多達25%的數據可以變得任意遠而不會很大地擾動四分位數,所以異常值不會影響箱形圖的數據形狀,箱線圖識別異常值的結果比較客觀。

2.利用箱線圖判斷數據批的偏態和尾重

對於標準正態分佈的樣本,只有極少值爲異常值。異常值越多說明尾部越重,自由度越小(即自由變動的量的個數);

而偏態表示偏離程度,異常值集中在較小值一側,則分佈呈左偏態;異常值集中在較大值一側,則分佈呈右偏態。

3.利用箱線圖比較幾批數據的形狀

 

圖解 

異常值:離羣值,超過上下限的值,被定義爲小於Q1-1.5IQR或大於Q3+1.5IQR的值。

IQR:上四分位-下四分位

 

(實例如下圖,box/hbox)

 

Vioplot 小提琴圖

顯示數據分佈及其概率密度

注:stata中未自帶需要安裝

安裝:【ssc install vioplot】

【vioplot varlist [if] [in] [weight] [,option] 】

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章