数据分析之相关分析

在很多研究中,研究者都把数据的相关性放在一个非常重要的位置上。甚至专门写上一整篇的文章阐述其研究变量之间的相关关系,足见其重要性。

 

通常,我们所说的“相关”都是一个较为模糊的概念,好像直觉告诉我们,这个事和那个人应该有关系,这个数字和那个现象似乎有联系,却始终没有办法得到一个明确的结论。

 

而相关分析则让这种模糊的直觉有了理论支持。如果想要考察两个变量之间是否存在相关性,我们第一个就会想到相关分析。

 

本文将从概念、散点图、相关系数、应用举例、结果分析、其他说明,共6个部分进行介绍。

 

01. 相关分析

相关分析是一种简单易行的测量定量数据之间的关系情况的分析方法。可以分析包括变量间的关系情况以及关系强弱程度等。

 

比如,身高和体重的相关性;降水量与河流水位的相关性;工作压力与心理健康的相关性等。

 

02. 散点图

相关分析前,首先通过散点图了解变量间大致的关系情况。

 

如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现。

SPSSAU散点图分析

例如上图,直观地展现了平时成绩与能力评分之间的关系情况:X增大时,Y会明显的增大,说明X和Y之间有着正向相关关系。

 

同时,SPSSAU还支持添加线性趋势线,用于分析预测变量可能的走向。

使用路径:SPSSAU->可视化->散点图

 

03. 相关系数

虽然散点图能够直观展现变量之间的关系情况,但并不精确。因此还需要通过相关分析得到相关系数,以数值的方式精准反映相关程度。

 

相关系数常见有三类,分别是:Pearson相关系数、Spearman等级相关系数和Kendall相关系数。

SPSSAU整理

 

其中,最常使用的是Pearson相关系数;当数据不满足正态性时,则使用Spearman相关系数,Kendall相关系数用于判断数据一致性,比如裁判打分。

 

04. 应用举例

例如,为研究平时成绩与能力水平之间的关系,调查收集了85位学生的平时成绩和能力测试成绩数据。

 

首先,用散点图对数据进行初步分析,上面已经展示出散点图结果,这里就不再展示。通过散点图分析大致可知,X增大时,Y会明显的增大,平时成绩和能力水平之间有着正相关关系。

 

然后对变量进行相关分析。

使用路径:SPSSAU->通用方法->相关

 

这里可以选择任意一种格式,结果都是一样的。

 

05. 结果分析

相关分析结果表格

 

分析步骤:

第一:首先看Y与X是否有显著关系即P值大小。
第二:接着分析相关关系为正向或负向,也可通过相关系数大小说明关系紧密程度

一般相关系数在0.7以上说明关系非常紧密;0.4~0.7之间说明关系紧密;0.2~0.4说明关系一般。

 

平均成绩和能力评分之间的相关系数值为0.491;同时,相关系数右上角有两个星号,代表p<0.01,因而说明平均成绩和能力评分之间有着显著的正相关关系。

 

SPSSAU智能分析建议

 

出现变量间相关系数很低,但是依然呈现出显著性的情况,此时说明关系较弱,但依然是有相关关系。也可能存在以下几种情况:

 

(1)异常值影响

如果数据中存在很明显的异常值(或离群值),会影响数据的分析结果。

解决方法:通过绘制散点图,查看数据是否存在异常值。并使用[ 数据处理 ]→[ 异常值 ]剔除异常值。

 

(2)分析方法选择错误

相关分析是研究定量数据与定量数据之间的关系情况。对于定类数据,相关分析并不适合。

变量类型和其对应分析方法的示意图,如下所示:

 

06. 其他说明

  1. 对于相关分析,分析时并不会区分X和Y,X与Y的相关系数等同于Y与X的相关系数。
  2. 如果多个量表题表示一个维度,可使用“生成变量”的平均值功能。将多个量表题合并成一个整体维度。

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章