【SPSS】百分位数计算方法探讨:SPSS计算差异

由一道课后题引发的思考,节约时间,先说结论:在数据量大时各个方法得到的值差距不大,在数据量较小时推荐使用【三 - 方法4】也就是SPSS的默认方法。

本周课程作业有一道非常简单(虽然事实证明此事并不简单)的题目,见下:

计算下列数据的第32位百分数
22 58 24 50 29 52 57 31 30 41
44 40 46 29 31 37 32 44 49 29

一、书上关于计算第p百分位数的步骤如下

  1. 以递增顺序排列原始数据(即从小到大排列)
  2. 计算指数 i=np%,其中n为项数(整个数列的个数)
  3. 若 i 不是整数,将 i 向上取整。大于 i 的毗邻整数即为第p百分位数的位置;若 i 是整数,则第p百分位数是第i项与第(i+1)项数据的平均值。

教材:《管理统计学》刘金兰著
注:根据 3 可知由此法计算出的百分位数小数点不超过一位(这也是为什么博主发现SPSS的结果好像哪里不对劲的原因)

回到刚才的题目计算中,在SPSS通过简单操作得到的答案:
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
问题出现了,这咋又不对呢?我们再来观察一下数据:我们排序后按照书上的方法计算Q1(25百分位)应该为:(29+30)/2=29.5,但SPSS的计算结果为29.25。

二、SPSS默认的计算方法:

  1. 将n个变量值从小到大排列,X(j)表示此数列中第j个数。
  2. 计算指数,设(n+1)P%=j+g,j为整数部分,g为小数部分。
  3. 当g=0时:P百分位数=X(j);当g≠0时:P百分位数=g*X(j+1)+(1-g)X(j)=X(j)+g[X(j+1)-X(j)]。

三、文献研究的计算探讨

在这里插入图片描述
1


  1. 虞仁和,胡国清,孙振球,黄正南.关于百分位数直接计算法的进一步探讨[J].中国卫生统计,2010,27(03):307-308. ↩︎

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章