【SPSS】百分位數計算方法探討:SPSS計算差異

由一道課後題引發的思考,節約時間,先說結論:在數據量大時各個方法得到的值差距不大,在數據量較小時推薦使用【三 - 方法4】也就是SPSS的默認方法。

本週課程作業有一道非常簡單(雖然事實證明此事並不簡單)的題目,見下:

計算下列數據的第32位百分數
22 58 24 50 29 52 57 31 30 41
44 40 46 29 31 37 32 44 49 29

一、書上關於計算第p百分位數的步驟如下

  1. 以遞增順序排列原始數據(即從小到大排列)
  2. 計算指數 i=np%,其中n爲項數(整個數列的個數)
  3. 若 i 不是整數,將 i 向上取整。大於 i 的毗鄰整數即爲第p百分位數的位置;若 i 是整數,則第p百分位數是第i項與第(i+1)項數據的平均值。

教材:《管理統計學》劉金蘭著
注:根據 3 可知由此法計算出的百分位數小數點不超過一位(這也是爲什麼博主發現SPSS的結果好像哪裏不對勁的原因)

回到剛纔的題目計算中,在SPSS通過簡單操作得到的答案:
在這裏插入圖片描述在這裏插入圖片描述
在這裏插入圖片描述
問題出現了,這咋又不對呢?我們再來觀察一下數據:我們排序後按照書上的方法計算Q1(25百分位)應該爲:(29+30)/2=29.5,但SPSS的計算結果爲29.25。

二、SPSS默認的計算方法:

  1. 將n個變量值從小到大排列,X(j)表示此數列中第j個數。
  2. 計算指數,設(n+1)P%=j+g,j爲整數部分,g爲小數部分。
  3. 當g=0時:P百分位數=X(j);當g≠0時:P百分位數=g*X(j+1)+(1-g)X(j)=X(j)+g[X(j+1)-X(j)]。

三、文獻研究的計算探討

在這裏插入圖片描述
1


  1. 虞仁和,胡國清,孫振球,黃正南.關於百分位數直接計算法的進一步探討[J].中國衛生統計,2010,27(03):307-308. ↩︎

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章