如何正確整理你的數據格式?

數據格式,直接影響着分析結果是否準確。小編最近也收到一些關於“數據格式”的提問,不知道自己的數據應該整理成什麼格式上傳分析?

 

正好在這裏統一分享幾種常見的數據格式,包括問卷數據、實驗數據、時序數據、面板數據以及一些特殊數據格式。希望今天的文章,能夠幫助你解決數據格式方面的困擾。

 

一、問卷數據

 

問卷數據是大家最常會用到的。此類數據的特點是:一行代表一個樣本,一列代表一個屬性。

 

這類格式攜帶着所有原始的數據信息,適用於各種分析方法。推薦大家將數據整理成此類格式。

 

多選題

 

問卷數據可能涉及多選題錄入。單選題錄入就是簡單的一個問題爲一列。根據答題者的選項,選擇哪個選項就把相應的序號填入即可。

 

錄入多選題時,要將多選題每一個選項看作一個單選題。選擇錄入爲1,不選擇錄入爲0。有幾個選項就要錄入幾列。

 

開放題

 

除了單選題、多選題,問卷研究中還有一類開放題型,如填空題。

 

文本格式系統無法直接分析。如果是在問卷平臺中生成的數據,建議大家導出[數字格式]的數據,再上傳到系統進行分析。

 

如果是手動錄入,建議先在EXECL裏整理,把意思相近的答案歸爲一類提取出關鍵詞表示,這樣後續可以採用頻數、詞雲分析等。

 

詞雲

 

二、實驗數據

 

實驗數據常見有兩種:一種是加權數據格式,一種是配對數據格式

 

加權數據格式,這類數據常見於醫學研究中。此類數據是整理的彙總統計數據,不能直接分析。一定要先進行加權處理。

 

 

加權數據的特點是數據中一定有:兩個變量(“組別”和“療效”)各佔一列,還有一列表示頻數(加權項)。

 

分析時,需將加權項放入加權項【可選】框裏。

 

所有數據中,只有定類數據才能整理成加權格式,因此,這類數據只能應用在一部分研究方法上。SPSSAU中支持加權數據的研究方法包括如下:

 

 

配對數據格式,常見於配對實驗設計中,涉及的研究方法包括配對t 檢驗,配對卡方等。可比較實驗組和對照組數據的差異或干預前後數據的差異。

 

 

配對數據的特點爲:行數一定完全相等並且只有兩列。分析時一定要特別注意。

 

三、時間序列數據

 

時間序列數據的格式包括時間和實際分析項共兩列。此類數據有明顯的時間順序,且順序不能更改,一定是從上至下日期遞增,中間不能有間隔。

 

 

四、面板數據

 

面板模型是針對面板數據進行分析,面板數據是一種特殊的數據格式。

 

這類數據的特點是可以同時取得時間和個體兩個維度的數據。

 

使用SPSSAU進行分析時,需要注意錄入個體ID(公司編號)和時間(年份)這兩列數據。

 

個體ID’就是上圖中的‘公司編號’,‘時間’就是‘年份’。‘公司編號’和‘年份’兩項共同用於提示系統當前爲面板數據。

 

五、特殊數據格式

 

還有一些比較特殊的數據格式。如綜合評價裏的模糊綜合評價、灰色關聯法等。

 

模糊綜合評價數據格式

灰色關聯法數據格式

 

建議使用這些方法之前,參考幫助手冊中的格式說明或視頻教程。

 

同時幫助手冊中也提供了多種數據格式說明,大家可以直接搜索進行查看。

 

 

-END-

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章