快速掌握卡方檢驗

01. 概念

 

卡方檢驗是一種用途廣泛的分析定類數據差異性的方法,用於比較定類與定類數據的關係情況,以及分析實際數據的比例與預期比例是否一致。

 

02. 方法分類

與T檢驗一樣,卡方檢驗也可細分爲:分析卡方優度檢驗、交叉表卡方、配對卡方。具體分析方法如下:

 

 

03. 卡方優度檢驗

卡方優度檢驗,是對一列數據進行統計檢驗,分析單個分類變量實際觀測的比例與期望比例是否一致。

 

案例:

當前收集了100份數據用於研究,其中有48名男性,52位女性。在收集數據前預期男女比例應該是4:6 (40%爲男性,60%爲女性),現在想分析實際收集到的數據比例與預期的比例有沒有顯著的差異。

 

操作步驟:

(1)卡方擬合優度檢驗支持兩種數據格式:整理後的加權數據 或 原始數據。處理好數據後,上傳數據到SPSSAU進行分析。

 

(2)選擇【實驗/醫學研究】→【卡方優度檢驗】。

  • 如使用原始數據,直接將“性別”項放入分析框即可。
  • 如使用加權格式數據,需要把將“性別”項放入分析框,同時在加權項中放入“個數(權重)”

 

加權格式

 

(3)設置期望值:不勾選【期望值設置】,系統會默認各比例相等,本例中期望比例爲4:6,所以需要手動設置。

 

 

小數/頻數格式均可

 

分析結果:

 

上表格顯示,男女的實際頻數分別是48和52,預期頻數分別是40和60;經過卡方擬合優度檢驗顯示,實際比例和期望比例並沒有呈現出顯著性差異(X2=2.667,p=0.102>0.05),意味着實際情況與期望情況基本一致,無明顯的差異性。

 

04.交叉表卡方

卡方優度檢驗是對一個分類變量的檢驗,在實際研究中,研究兩組分類變量的關係更加常見,例如想要了解閱讀習慣與學歷是否有關,此時可使用交叉卡方。

 

案例:分析不同性別學生對購買理財產品的意願是否有差異

 

操作步驟:

使用路徑:通用方法→交叉(卡方)

 

可以選擇按行統計百分數或者按列統計百分數,區別在於括號內百分數一個按列計算,一個按行計算,案例中選擇“百分數(按列)”

 

交叉(卡方)分析結果

 

結果分析:

從上表可以看出,不同性別樣本對於是否購買理財產品的意願不會表現出顯著性差異,說明性別和購買理財產品之間沒有聯繫。反之,呈現出顯著性;則說明性別對購買意願會有影響,具體差異需要通過對比百分比得到。

 

其他指標分析:

如果檢驗得出兩變量之間確實存在聯繫(結果有顯著性差異),想要進一步瞭解兩者的相關程度,需要結合效應量指標具體分析。SPSSAU提供5種指標;分別是:Phi係數、列聯繫數、、校正列聯繫、Cramer V係數、Lambda指標。

 

*X或Y中有定序數據,則建議使用Lambda指標

*交叉類型表示交叉表橫向格子數×縱向格子數

 

05. 配對卡方

除了以上兩種分析場景外,有時還需要分析配對分類數據的差異性。此類數據最常見於實驗研究,用不同的方法檢測同一批人,看兩個方法的效果是否有差異。此時可使用配對卡方檢驗。

 

案例應用:

當前有兩種辦法可以診斷癌症,A方法簡易且成本低廉但是準確率稍低;B方法結果可靠但操作麻煩且成本較高。共收集53名待診患者,並且分別進行兩種方法診斷,現希望通過研究判斷兩種診斷方法是否有差異。​此數據爲配對數據,而且爲定類數據(診斷結果爲定類數據),因而需要使用配對卡方檢驗。

 

操作步驟:

 

使用路徑:SPSSAU→醫學研究→配對卡方

 

結果分析:

 

配對卡方分析結果

 

配對卡方有兩種檢驗統計量,分別是McNemar檢驗和Bowker檢驗。二者的區別如下:

 

本案例中兩種方法均只有陽性和陰性兩種結果時,因此選擇McNemar檢驗,SPSSAU會自動判斷,匹配合適的方法。

 

 

SPSSAU智能分析建議

 

06. 其他說明

事實上,計算卡方值的方法不止一種,常見包括Pearson卡方,yates校正卡方,fisher卡方,具體要結合期望頻數、R*C交叉類型等選擇採不同的檢驗方法。SPSSAU可自動選擇最優方法,因此不需單獨考慮使用哪種方法。

 

更多幹貨內容可登錄SPSSAU官網查看,在線體驗快速數據分析
 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章