【轉】箱線圖

作者:海致BDP
鏈接:https://www.zhihu.com/question/36172806/answer/308908220
來源:知乎
著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。
 

箱線圖判斷異常值的標準以四分位數和四分位距爲基礎,四分位數具有一定的耐抗性,多達25%的數據可以變得任意遠而不會很大地擾動四分位數,所以異常值不會影響箱形圖的數據形狀,箱線圖識別異常值的結果比較客觀。由此可見,箱線圖在識別異常值方面有一定的優越性。

1、下四分位數Q1

(1)確定四分位數的位置。Qi所在位置=i(n+1)/4,其中i=1,2,3。n表示序列中包含的項數。

(2)根據位置,計算相應的四分位數。

例中:

Q1所在的位置=(14+1)/4=3.75,

Q1=0.25×第三項+0.75×第四項=0.25×17+0.75×19=18.5;

2、中位數(第二個四分位數)Q2

中位數,即一組數由小到大排列處於中間位置的數。若序列數爲偶數個,該組的中位數爲中間兩個數的平均數。

例中:

Q2所在的位置=2(14+1)/4=7.5,

Q2=0.5×第七項+0.5×第八項=0.5×25+0.5×28=26.5

3、上四分位數Q3

計算方法同下四分位數。

例中:

Q3所在的位置=3(14+1)/4=11.25,

Q3=0.75×第十一項+0.25×第十二項=0.75×34+0.25×35=34.25。

4、上限

上限是非異常範圍內的最大值。

首先要知道什麼是四分位距如何計算的?

四分位距IQR=Q3-Q1,那麼上限=Q3+1.5IQR

5、下限

下限是非異常範圍內的最小值。

下限=Q1-1.5IQR

 

BDP個人版箱形圖效果:

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章