【在線SPSS】數據分析思維培養系列3:分析思路篇

目錄

第一部分 把控數據思維

第二部分 問卷量表思維參考

第三部分 問卷非量表思維參考

第四部分 其它

 


本文章爲SPSSAU數據分析思維培養的第3期文章。

 

上文講解如何選擇正確的分析方法,除了有正確的分析方法外,還需要把分析方法進行靈活運用。拿到一份數據,應該如何進行分析,總共有幾個步驟,第一步第二步應該做什麼,需要有個宏觀把控,這樣纔能有規範的研究科學的思維和邏輯。

 

本文章首先闡述分析的整體思維,即整體把控住應該如何剖析一份數據做到心理有數,接着針對常見的問卷進行思維剖析,並且提供思路框架,期許爲大家帶來一絲絲幫助。

 

第一部分 把控數據思維

 

如果想要把控好數據思維,簡單來講在拿到一份數據後如何進行分析,心裏應該有個底。做到以下幾點,相信可以更好地理解數據思維。首先是針對數據特徵描述,其次是對數據質量說明,研究目的是什麼如何使用研究方法或措施去匹配論證研究目的,最後把數據結果呈現出來並且進行討論說明。

1、數據特徵描述

拿到一份數據時,首先看下數據的特徵,比如性別的分佈情況如何,平均年齡情況如何。當然這裏是需要區分定類和定量數據分別進行描述,比如性別是定類數據使用百分比頻數說明,年齡是定量數據使用平均值或中位數進行描述說明,在‘數據分析思維培訓之2’裏面有詳細說明。

 

爲什麼首先需要對數據特徵進行描述呢?簡單來講,每份數據都有自己的background,研究是基本數據進行,首先需要告訴下別人我研究的數據是一羣什麼樣的人或者物體。在此基礎上才能進行後續的進一步分析。

 

如果研究羣體出問題自然後續結論也會有問題,比如研究00後羣體,但數據是基本80後,不同羣體對於同一事情很可能有着不同的觀點和態度。而且在最後進行說明討論的時候也是基本樣本羣體的特徵而進行,因此,在數據分析時,通常首先需要描述清楚研究羣體到底是什麼樣的。

 

2、數據質量說明

接着,一般需要對數據的質量進行說明,此步驟可以使用研究方法,比如信度分析組內相關係數ICC等等進行說明,但有時候數據不適合分析方法要求因而不能使用分析方法進行研究。此時正確的做法是詳細描述清楚數據的來源,比如實驗數據的背景情況下是什麼,基於什麼樣的實驗條件因素進行等,充分證明數據的質量可靠即可。形式不限,文字描述或者使用研究方法等均可。

 

3、研究目的剖析

對於數據基本特徵和數據質量剖析後,接下來最關鍵的步驟是結合自己的研究目的進行。一般來說研究目的可分爲兩大類,一是差異關係研究;二是影響關係研究,以及其它。

 

比如不同性別羣體是否吸菸的差異性,不同性別羣體對於奢侈品的購買意願或購買行爲差異性。差異關係是一種常見且通用的研究方法,一般涉及到比如卡方分析、方差分析、T檢驗等,結合自己的數據類型進行選擇使用即可。而對於影響關係而言,更多出現於學術研究中,通過影響關係研究去論證觀點的正確性,影響關係通常可使用比如線性迴歸、logistic迴歸、嶺迴歸、Robust迴歸等。

 

具體不同的研究方法可能對應着不同的數據類型,但都不復雜,關鍵的地方在於符合研究的目的。有時候爲了研究目的服務,可能還會對數據進行‘中間過程處理’,比如對於數據的信息濃縮,可使用因子分析等;或者對於樣本羣體的聚類,可首先進行聚類分析,然後聚類出不同類別羣體再做後續的分析使用。研究目的通常是在準備數據之前就已經確定,因爲先有思路再有數據的準備,最後纔是進行分析。

 

4、數據結果呈現

在進行數據研究時,很可能需要對於數據結果進行呈現,通常是兩種方式分別是表格和圖。表格是通用的方式,但其比較‘枯燥’。因而很多時候需要結合數據情況進行可視化即圖形展示。一般針對定類數據的圖形較多,比如餅圖、條形圖、柱形圖,帕累託圖,詞雲圖等;而涉及到定量數據,由於其通過平均值進行表達描述,因而更多可能會使用比如折線圖,簇狀圖等,當然如果是純統計角度上,還可能的比如箱線圖,散點圖,直方圖,PPQQ等,均可在SPSSAU中快速的找到;分析與數據呈現是連在一起的,有了數據研究結論一定需要用某種形式呈現出來,無非是選擇圖或表,也或者二者均用;核心在於可以直觀快速的呈現出結果。

 

數據分析思路事實上還有很多,比如模型的靈活運用,模型的選擇使用等,同樣的數據和研究目的,很可能使用到不同的研究模型,比如研究影響關係,都是定量數據。很可能會使用到線性迴歸、路徑分析等,此時可結合實際情況,以及自身的理解綜合評估即可,並無絕對對應關係。

 

第二部分 問卷量表思維參考

 

問卷數據是常見的一種數據來源,而且問卷中很多時候會使用到量表數據,針對此種量表數據,SPSSAU提供一種分析思路參考如下圖:

 

 

其實從上表可知,第1和第2點均是對於數據特徵進行描述。接着第4和第5點屬於數據質量研究。第3點是爲第6,7,8,9這4點服務。第6點是核心研究數據的特徵描述。第7和第8點相關和假設分析屬於影響關係的分析範疇。最後第9點是差異關係的範疇。

 

沒有絕對的研究步驟,但從上圖可以看到,基本上是先數據特徵描述,接着數據質量分析,再接着核心研究數據的特徵描述,進一步影響關係研究,最後差異關係研究。至於細節性問題,比如信度和效度分析誰先誰後,一般而言是信度在前效度在後。影響關係和差異關係誰先誰後呢?看研究目的,越重要的越放前,相對不重要的靠後即可。

 

第三部分 問卷非量表思維參考

 

針對非量表類問卷,非量表類問卷最大的特點是:非常多的單選題,多選題等,通常此類問卷用於政策現狀研究、基本態度情況研究等。如果此類問卷,多數是使用頻數分析,以及涉及多選題的幾類方法;同時還有交叉卡方分析。

 

 

思路上第1和第2點屬於數據特徵描述,先搞清楚研究數據的基本背景特徵情況。接着對於核心研究項進行特徵描述,即第3和第4點。除此之外還可以進行差異關係研究,即第5點,一般使用卡方分析。第6點影響關係研究一般會使用到logistic迴歸分析等。分析思路上緊密相聯,先數據特徵描述,核心變量特徵描述,差異關係,影響關係研究,並且在最後進行彙總。

 

第四部分 其它

 

在數據分析思路上,還會有很多種類型,本文並沒有提供到權重研究,事實上很多研究目的在於計算權重體系,當然此種情況目的非常清晰,主要奔着研究目的去就好,正常情況下都會使用到SPSSAU綜合評價裏面的研究方法。

 

 

除了權重體系的構建,還有聚類數據,把數據樣本羣體分成幾個類別等分析思路,先把思路確認好,接着大致就可以對應上正確的數據分析方法,準備好數據直接分析就可以。

 

更多涉及到數據思路上的資料可在SPSSAU手冊裏面找到參考,包括影響關係類研究,現狀政策類研究,調節/中介類研究,實驗類差異研究和聚類樣本類研究共五類思路等。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章