簡單易懂!一文理清主成分分析思路

主成分分析是一種濃縮數據信息的方法,可將很多個指標濃縮成綜合指標(主成分),並保證這些綜合指標彼此之間互不相關。可用於簡化數據信息濃縮、計算權重、競爭力評價等。

 

一、研究背景

某研究想要了解各地區高等教育發展水平的綜合排名。從中選取30個地區10個評價指標,使用主成分分析進行降維,並計算綜合得分。

 

二、操作步驟

(1)點擊【進階方法】--【主成分】。

 

(2)將分析項拖拽至右側,勾選[成分得分]、[綜合得分]。點擊開始分析。

 

也可以根據自己的分析需要,主動設置主成分個數。

 

三、分析思路

Step1:判斷是否適合進行主成分分析

 

上表展示KMO檢驗和Bartlett 的檢驗結果,用來看此數據適不適合進行主成分分析。

通常KMO值的判斷標準爲0.6。大於0.6說明適合進行分析,反之,說明不適合進行分析。同時Bartlett檢驗對應P值小於0.05也說明適合分析。

SPSSAU輸出的結果中會給出智能解讀結果,直接查看智能分析:

 

Step2:確定主成分個數,及判斷主成分與分析項對應關係

確定可以使用主成分分析後,下一步重點確定主成分個數。

方差解釋率表格主要用於判斷提取多少個主成分合適。以及每個主成分的方差解釋率和累計方差解釋率情況。方差解釋率越大說明主成分包含原數據信息的越多。

 

從上表可知:本次共提取了2個主成分。這2個主成分的方差解釋率分別是75.024%,15.767%,累積方差解釋率爲,90.791%。說明兩個主成分能夠表達10個分析項90.791%的信息量,主成分分析效果很好。

碎石圖

 

同時可結合碎石圖輔助判斷主成分提取個數。

當折線由陡峭突然變得平穩時,陡峭到平穩對應的主成分個數即爲參考提取主成分個數。實際研究中更多以專業知識,結合主成分與研究項對應關係情況,綜合權衡判斷得出主成分個數。

 

載荷係數表格,主要展示主成分對於研究項的信息提取情況,以及主成分和研究項對應關係。

藍色數值代表載荷係數絕對值大於0.4,如高等院校數對應的載荷係數(0.958,-0.247)說明這個分析項更適合歸於主成分1下。

共同度代表某題項可被提取的信息量,共同度越高說明指標能被主成分解釋的程度越高,被提取的信息量越多。一般以0.4作爲標準。

從結果中可以看出,主成分1中反映高等院校數X1、畢業生數X2、招生人數X3、在校生數X4、教職工數X5、專職教師數X6、教育經費佔國內生產總值比重X9、生均教育經費X10,共八個指標的信息。

主成分2反映高級職稱佔專職教師的比例X7、院校平均在校生數X8兩個指標的信息。共同度均超過0.4,說明各指標均能被2個主成分較好地解釋。

 

Step3:利用主成分得到綜合得分

根據之前勾選的[綜合得分],即可自動得到綜合得分結果。

SPSSAU默認命名爲CompScore_XXXX。使用【數據處理】→【標題處理】功能可以對題目重命名。

 

 

在頁面右上角【我的數據】中可以具體查看具體的綜合得分。綜合得分值越大表示越有競爭力,也就說明該地區高等教育發展水平越發達。

 

 

Step4:得到綜合排名情況

【數據處理】→【生成變量】裏的排名功能。點擊“綜合得分”,再選擇“排名(Rank)”,點擊確認處理。

 

 

下載後可使用EXCEL對數據進行整理,最終結果如下:

 

四、疑問解答

 

問題1:綜合得分具體如何計算?

SPSSAU提供一鍵生成綜合得分非常方便,但也會有人有疑問:綜合得分是怎麼計算得到?如果想描述計算過程應該怎麼說?

綜合得分實際就等於每個主成分得分乘以各自權重求和所得的結果。

(綜合得分=主成分1得分*主成分1權重+主成分2得分*主成分2權重+.....)

“主成分得分”可以通過勾選[成分得分],由SPSSAU自動輸出。

勾選成分得分

 

本次共提取2個主成分,因此分別生成2個主成分得分。

主成分得分

 

有了主成分得分,下面要解決權重問題。如何計算得到每個主成分的權重?

權重是以各主成分對應的方差貢獻率除以累計方差貢獻率

以本例來說,2個主成分的方差解釋率分別是75.024%,15.767%,累積方差解釋率爲,90.791%。

主成分1的權重:75.024%/90.791%=82.63%

主成分2的權重:15.767%/90.791%=17.37%

權重結果在智能分析中也有提供,可以直接使用。

成分得分和權重都得到即可計算綜合得分。

F=82.63%*主成分1得分+17.37%*主成分2得分

 

問題2:分析之前是否需要對數據進行標準化處理?

SPSSAU默認就已經進行過標準化處理,因此不需要再對數據處理。當然標準化後的數據再次標準化依舊還是自身沒有任何變化,結果均一致。

 

問題3:相關性矩陣在哪裏計算?

可使用【通用方法】--【相關】得到相關矩陣。

通過相關矩陣可以看出哪些指標之間相關性較強,哪些指標之間相關性不大。

 

五、其他說明

主成分分析的作用更多側重於計算權重、計算綜合競爭力。不會過多關注主成分與分析項對應關係,不要求每個主成分有明確的含義。如果研究目的側重於濃縮題項信息,更建議採用因子分析。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章