箱型圖Box
覺得有用的話,歡迎一起討論相互學習~Follow Me
- 又稱爲盒須圖、盒式圖、盒狀圖或箱線圖,是一種用作顯示一組數據分散情況資料的統計圖。
- 箱形圖最大的優點就是不受異常值的影響,能夠準確穩定地描繪出數據的離散分佈情況,同時也利於數據的清洗。
例子
- 有一組數據爲: 12,15,17,19,20,23,25,28,30,33,34,35,36,37
1、下四分位數Q1
-
確定四分位數的位置。Qi所在位置=i(n+1)/4,其中i=1,2,3。n表示序列中包含的項數。
-
根據位置,計算相應的四分位數。
例中:
Q1所在的位置=(14+1)/4=3.75,
Q1=0.25×第三項+0.75×第四項=0.25×17+0.75×19=18.5;
2、中位數(第二個四分位數)Q2
中位數,即一組數由小到大排列處於中間位置的數。若序列數爲偶數個,該組的中位數爲中間兩個數的平均數。
例中:
Q2所在的位置=2(14+1)/4=7.5,
Q2=0.5×第七項+0.5×第八項=0.5×25+0.5×28=26.5
3、上四分位數Q3
計算方法同下四分位數。
例中:
Q3所在的位置=3(14+1)/4=11.25,
Q3=0.75×第十一項+0.25×第十二項=0.75×34+0.25×35=34.25。
4、上限
上限是非異常範圍內的最大值。
首先要知道四分位距如何計算的?
四分位距IQR=Q3-Q1,那麼上限=Q3+1.5IQR
5、下限
下限是非異常範圍內的最小值。
下限=Q1-1.5IQR
應用
- 在EC領域一般是這樣用的