python實現matplotlib繪製箱型圖

箱線圖

箱形圖(Box-plot)又稱爲盒須圖、盒式圖或箱線圖,是一種用作顯示一組數據分散情況資料的統計圖。因形狀如箱子而得名。在各種領域也經常被使用,常見於品質管理。(來源:百度百科【箱型圖】詞條)

在這裏插入圖片描述
箱形圖有5個參數:

  • 下邊緣(Q1),表示最小值;
  • 下四分位數(Q2),又稱“第一四分位數”,等於該樣本中所有數值由小到大排列後第25%的數字;
  • 中位數(Q3),又稱“第二四分位數”等於該樣本中所有數值由小到大排列後第50%的數字;
  • 上四分位數(Q4),又稱“第三四分位數”等於該樣本中所有數值由小到大排列後第75%的數字;
  • 上邊緣(Q5),表述最大值。
  • 第三四分位數與第一四分位數的差距又稱四分位間距。

箱型圖有個功能就是可以檢測這組數據是否存在異常值。異常值在哪裏呢?就是在上邊緣和下邊緣的範圍之外。

繪製

plt.boxplot(x, notch=None, sym=None, vert=None, 
             whis=None, positions=None, widths=None, 
             patch_artist=None, meanline=None, showmeans=None, 
             showcaps=None, showbox=None, showfliers=None, 
             boxprops=None, labels=None, flierprops=None, 
             medianprops=None, meanprops=None, 
             capprops=None, whiskerprops=None)

x:指定要繪製箱線圖的數據;
notch:是否是凹口的形式展現箱線圖,默認非凹口;
sym:指定異常點的形狀,默認爲+號顯示;
vert:是否需要將箱線圖垂直襬放,默認垂直襬放;
whis:指定上下須與上下四分位的距離,默認爲1.5倍的四分位差;
positions:指定箱線圖的位置,默認爲[0,1,2…];
widths:指定箱線圖的寬度,默認爲0.5;
patch_artist:是否填充箱體的顏色;
meanline:是否用線的形式表示均值,默認用點來表示;
showmeans:是否顯示均值,默認不顯示;
showcaps:是否顯示箱線圖頂端和末端的兩條線,默認顯示;
showbox:是否顯示箱線圖的箱體,默認顯示;
showfliers:是否顯示異常值,默認顯示;
boxprops:設置箱體的屬性,如邊框色,填充色等;
labels:爲箱線圖添加標籤,類似於圖例的作用;
filerprops:設置異常值的屬性,如異常點的形狀、大小、填充色等;
medianprops:設置中位數的屬性,如線的類型、粗細等;
meanprops:設置均值的屬性,如點的大小、顏色等;
capprops:設置箱線圖頂端和末端線條的屬性,如顏色、粗細等;
whiskerprops:設置須的屬性,如顏色、粗細、線的類型等;

Demo

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
np.random.seed(2)  #設置隨機種子
df = pd.DataFrame(np.random.rand(5,4),
columns=['A', 'B', 'C', 'D'])#先生成0-1之間的5*4維度數據,再裝入4列DataFrame中
df.boxplot() #也可用plot.box()
plt.show()

在這裏插入圖片描述

修飾

https://www.jianshu.com/p/fa29c7e4d4de

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章