試驗研究中的利器--強大的直方圖和箱線圖
“直方圖和箱線圖屬於描述統計學範疇。
箱線圖:
箱線圖顧名思義最重要的兩個成分就是箱和線。那麼箱和線分別代表什麼呢?我們首先來看中間這個箱子以及中間那條粗線:
中間粗線代表中位數(如果是標準正態分佈,中位數和平均值是一樣的,位置在小箱子的中間位置)。箱子大小代表的是四分位數間距(IQR),也稱爲中間50%間距,是統計離散度的度量,等於第75和第25百分位數之間的差異,或者說是在上下四分位數之間,即:IQR = Q3-Q1。(這一句話中出現的分位數,四分位數,和百分位數在英語中對應了三個單詞quantile,quartile,和percentile,
“分位數(英語:Quantile),亦稱分位點,是指用分割點(cut point)將一個隨機變量的概率分佈範圍分爲幾個具有相同概率的連續區間。分割點的數量比劃分出的區間少1,例如3個分割點能分出4個區間。常用的有中位數(即二分位數)、四分位數(quartile)、十分位數(decile )、百分位數等。q-quantile是指將有限值集分爲q個接近相同尺寸的子集。”
“百分位數統計學術語,如果將一組數據從小到大排序,並計算相應的累計百分位,則某一百分位所對應數據的值就稱爲這一百分位的百分位數。可表示爲:一組n個觀測值按數值大小排列。如,處於p%位置的值稱第p百分位數。”