數據格式,直接影響着分析結果是否準確。小編最近也收到一些關於“數據格式”的提問,不知道自己的數據應該整理成什麼格式上傳分析?
正好在這裏統一分享幾種常見的數據格式,包括問卷數據、實驗數據、時序數據、面板數據以及一些特殊數據格式。希望今天的文章,能夠幫助你解決數據格式方面的困擾。
一、問卷數據
問卷數據是大家最常會用到的。此類數據的特點是:一行代表一個樣本,一列代表一個屬性。
這類格式攜帶着所有原始的數據信息,適用於各種分析方法。推薦大家將數據整理成此類格式。
多選題
問卷數據可能涉及多選題錄入。單選題錄入就是簡單的一個問題爲一列。根據答題者的選項,選擇哪個選項就把相應的序號填入即可。
錄入多選題時,要將多選題每一個選項看作一個單選題。選擇錄入爲1,不選擇錄入爲0。有幾個選項就要錄入幾列。
開放題
除了單選題、多選題,問卷研究中還有一類開放題型,如填空題。
文本格式系統無法直接分析。如果是在問卷平臺中生成的數據,建議大家導出[數字格式]的數據,再上傳到系統進行分析。
如果是手動錄入,建議先在EXECL裏整理,把意思相近的答案歸爲一類提取出關鍵詞表示,這樣後續可以採用頻數、詞雲分析等。
詞雲
二、實驗數據
實驗數據常見有兩種:一種是加權數據格式,一種是配對數據格式。
加權數據格式,這類數據常見於醫學研究中。此類數據是整理的彙總統計數據,不能直接分析。一定要先進行加權處理。
加權數據的特點是數據中一定有:兩個變量(“組別”和“療效”)各佔一列,還有一列表示頻數(加權項)。
分析時,需將加權項放入加權項【可選】框裏。
所有數據中,只有定類數據才能整理成加權格式,因此,這類數據只能應用在一部分研究方法上。SPSSAU中支持加權數據的研究方法包括如下:
配對數據格式,常見於配對實驗設計中,涉及的研究方法包括配對t 檢驗,配對卡方等。可比較實驗組和對照組數據的差異或干預前後數據的差異。
配對數據的特點爲:行數一定完全相等並且只有兩列。分析時一定要特別注意。
三、時間序列數據
時間序列數據的格式包括時間和實際分析項共兩列。此類數據有明顯的時間順序,且順序不能更改,一定是從上至下日期遞增,中間不能有間隔。
四、面板數據
面板模型是針對面板數據進行分析,面板數據是一種特殊的數據格式。
這類數據的特點是可以同時取得時間和個體兩個維度的數據。
使用SPSSAU進行分析時,需要注意錄入個體ID(公司編號)和時間(年份)這兩列數據。
個體ID’就是上圖中的‘公司編號’,‘時間’就是‘年份’。‘公司編號’和‘年份’兩項共同用於提示系統當前爲面板數據。
五、特殊數據格式
還有一些比較特殊的數據格式。如綜合評價裏的模糊綜合評價、灰色關聯法等。
模糊綜合評價數據格式
灰色關聯法數據格式
建議使用這些方法之前,參考幫助手冊中的格式說明或視頻教程。
同時幫助手冊中也提供了多種數據格式說明,大家可以直接搜索進行查看。
-END-