數據分析之相關分析

在很多研究中,研究者都把數據的相關性放在一個非常重要的位置上。甚至專門寫上一整篇的文章闡述其研究變量之間的相關關係,足見其重要性。

 

通常,我們所說的“相關”都是一個較爲模糊的概念,好像直覺告訴我們,這個事和那個人應該有關係,這個數字和那個現象似乎有聯繫,卻始終沒有辦法得到一個明確的結論。

 

而相關分析則讓這種模糊的直覺有了理論支持。如果想要考察兩個變量之間是否存在相關性,我們第一個就會想到相關分析。

 

本文將從概念、散點圖、相關係數、應用舉例、結果分析、其他說明,共6個部分進行介紹。

 

01. 相關分析

相關分析是一種簡單易行的測量定量數據之間的關係情況的分析方法。可以分析包括變量間的關係情況以及關係強弱程度等。

 

比如,身高和體重的相關性;降水量與河流水位的相關性;工作壓力與心理健康的相關性等。

 

02. 散點圖

相關分析前,首先通過散點圖瞭解變量間大致的關係情況。

 

如果變量之間不存在相互關係,那麼在散點圖上就會表現爲隨機分佈的離散的點,如果存在某種相關性,那麼大部分的數據點就會相對密集並以某種趨勢呈現。

SPSSAU散點圖分析

例如上圖,直觀地展現了平時成績與能力評分之間的關係情況:X增大時,Y會明顯的增大,說明X和Y之間有着正向相關關係。

 

同時,SPSSAU還支持添加線性趨勢線,用於分析預測變量可能的走向。

使用路徑:SPSSAU->可視化->散點圖

 

03. 相關係數

雖然散點圖能夠直觀展現變量之間的關係情況,但並不精確。因此還需要通過相關分析得到相關係數,以數值的方式精準反映相關程度。

 

相關係數常見有三類,分別是:Pearson相關係數、Spearman等級相關係數和Kendall相關係數。

SPSSAU整理

 

其中,最常使用的是Pearson相關係數;當數據不滿足正態性時,則使用Spearman相關係數,Kendall相關係數用於判斷數據一致性,比如裁判打分。

 

04. 應用舉例

例如,爲研究平時成績與能力水平之間的關係,調查收集了85位學生的平時成績和能力測試成績數據。

 

首先,用散點圖對數據進行初步分析,上面已經展示出散點圖結果,這裏就不再展示。通過散點圖分析大致可知,X增大時,Y會明顯的增大,平時成績和能力水平之間有着正相關關係。

 

然後對變量進行相關分析。

使用路徑:SPSSAU->通用方法->相關

 

這裏可以選擇任意一種格式,結果都是一樣的。

 

05. 結果分析

相關分析結果表格

 

分析步驟:

第一:首先看Y與X是否有顯著關係即P值大小。
第二:接着分析相關關係爲正向或負向,也可通過相關係數大小說明關係緊密程度

一般相關係數在0.7以上說明關係非常緊密;0.4~0.7之間說明關係緊密;0.2~0.4說明關係一般。

 

平均成績和能力評分之間的相關係數值爲0.491;同時,相關係數右上角有兩個星號,代表p<0.01,因而說明平均成績和能力評分之間有着顯著的正相關關係。

 

SPSSAU智能分析建議

 

出現變量間相關係數很低,但是依然呈現出顯著性的情況,此時說明關係較弱,但依然是有相關關係。也可能存在以下幾種情況:

 

(1)異常值影響

如果數據中存在很明顯的異常值(或離羣值),會影響數據的分析結果。

解決方法:通過繪製散點圖,查看數據是否存在異常值。並使用[ 數據處理 ]→[ 異常值 ]剔除異常值。

 

(2)分析方法選擇錯誤

相關分析是研究定量數據與定量數據之間的關係情況。對於定類數據,相關分析並不適合。

變量類型和其對應分析方法的示意圖,如下所示:

 

06. 其他說明

  1. 對於相關分析,分析時並不會區分X和Y,X與Y的相關係數等同於Y與X的相關係數。
  2. 如果多個量表題表示一個維度,可使用“生成變量”的平均值功能。將多個量表題合併成一個整體維度。

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章