大數據時代,我竟然在用Excel和SPSS做數據分析,真香!

目錄

寫在前面

本篇文章介紹的是基於Excel和SPSS的數據分析和數據可視化操作.大數據時代,我們每天接受的數據量是巨大的,只有分析數據之間的聯繫進而纔可能得到商機和"錢"途,本篇文章將從最基礎的概念入手到實際的對數據的分析實戰,從Excel和SPSS兩個方面對數據進行分析.

概述

基於SPSS和Excel寫了的調查數據分析

什麼是統計?

統計學是用已收集數據.分析數據並進而由數據得出結論的一組概念.原則和方法,因而也有人稱統計學爲統計方法

統計.計算機與統計軟件

SPSS和Excel

(重點)變量及其分類

變量:用來描述總體中成員的某一特性

數據收集

第二章

問卷的組成和結構

問卷組成:封面信(目的).指導語(如何填寫問卷).問題.答案.編碼幾個部分組成

問題可分爲開放式問題封閉式問題:

編碼:指的是將問題和答案用一個字母或者數字來代替

問卷的結構:開頭,正文(調查信息和背景資料)和結尾(可以設置開放題,徵詢被調查者的意見或者感受,也可以是感謝語以及其他補充說明)三部分組成

幾種典型的問卷題型:

1填空題(一般就是填數字的填空題,讓調查者容易回答,容易填寫的問題可以設置爲填空題)

2.二項單選題:

問題的答案只有不是(或其他形式但是隻有肯定和否定兩種形式)

回答者根據自己的情況選擇其一

3.多項單選題

給出的答案至少在兩個以上,回答者根據自己的情況選擇其中一種作爲回答,這是各種社會調查問卷中採用最多的一種問題形式,其答案特別適合進行頻率分析交叉分析,在設計上,這種問題形式的關鍵之處是保證答案的窮盡性互斥性

4.多項限選題

多項限選也稱爲限選不排序,與多項選一(多項單選題)有所不同的是,可以在所列舉的多個答案中,要求回答者根據自己的情況選擇若干個

5.多項排序選(後面處理這種問題是需要加權值進行處理的)

多項排序選也稱爲限選排序,這種題目可以是針對多項限選題(限選不排序)的不足而出現的一種問題類型,在一定程度上可以看成是多項單選題和多項限選題的一種結合.

6.多項任選題

多項任選也稱爲不限選.多項任選題是在所提供的的答案中,被調查者可以任意選擇各種不同答案的一種問題形式.

7.矩陣題(表格題)

採用矩陣(表格)的形式將同一類型的若干個問題集中在一起,構成一個"大"問題矩陣題通常採用李克特量表

8.相倚問題

答案的設計

窮盡性互斥性

窮盡性:表示了答案包括了所有可能的情況

互斥性:指的是答案之間不能交叉重疊互相包含

量表

量表主要是用來測量人們的感覺或者主觀判斷,它的測量邏輯是假定有相同主觀感覺的人會在一個由弱到強的連續線段(維度)的相同位置,標出自己的感覺.

(1)李克特量表 (答案類型在4~8個之間)

(2)博加德斯社會距離量表

(3)語義差異量表(要確定的是人們對於某一事件或者事務的感覺,先找到最強和最弱,然後分爲不同的等級,一般爲7分等級)

第三章:數據的錄入和清理

數據的錄入

在統計分析之前,必須將問卷數據錄入計算機,而在錄入之前需要對錄入的數據進行覈對和清理

Excel技巧:

要改動多個單元格的值爲同一個值時

在Ctrl選擇多個單元格,寫要修改的值然後按Ctrl+Enter確定.

1.單選題的錄入(注意題目和答案都用字母或者數字表示)

2.多項單選題

3.多項限選題(兩種處理方式:二分法和分類法):建議使用分類法,這樣變量的取值比較少

二分法

二分法的關鍵是:把每個小答案都分爲兩份,選或者不選(選擇這個小選項則用1表示,否則置空表示不選)

二分法:有幾個選項就取多少個變量,每個變量有兩個取值,一個是1,一個是空,做多限選的個數就是變量中最多能選擇的個數.

分類法:

分類法:是隻有三個(幾項限選就是幾個)變量,每個變量的取值都可以是任意的一個答案選項代表的數字或者字母.

相當於把答案分爲了n類,每個變量的取值都可以是任意一個選項

二分法相當於把每個選項分爲兩類,選或者不選

4.多項不限選(推薦使用二分法)

在Excel中求均值.最大值.最小值
:=average()=max()=min() 均值: = average(單元格範圍) \\最大值 = max(單元格範圍) \\最小值 = min(單元格範圍)

如果是處理填空題中的求均值,一般把一組數據中的組中值作爲該組的度量的標準參與計算,這裏可能會使用到if函數

在Excel中使用if函數
=if(,,):if = if(函數條件,真值,假值) \\注意:if函數是可以嵌套的
量表:

排序題:

數據的清理

  • 數據有效範圍的清理
    • 對數據中的奇異值進行清理,例如:在數據錄入中,性別男用1,女用2,那麼3就屬於奇異值
  • 數據邏輯一致性的清理
    • 在相倚問題和多項限選題中出現較多,如有問題1:您是否有手機,問題2:您的手機平均月費,那麼就不能沒有手機還有月費
  • 數據質量的抽查

image-20200528220557102

image-20200528220700664

3.4在Excel中核對數據

  • 篩選出範圍不合理的單列
    • 在Excel中核對"大小適中"的數據
  • 用自動篩選找出不合理的關聯題
    • “是否有手機"和"平均月費”
  • 用高級篩選找出重複的記錄
    • 重複記錄

簡單篩選:僅僅只篩選出一個選項不符合範圍的問卷(這樣可能會導致我們需要多次篩選才能得到所有的不符合範圍的問卷的編號)

步驟:

  1. 點擊篩選
  2. 在標題中選擇不合理的範圍或者自己定義不合理範圍的篩選條件

高級篩選出所有不符合範圍的問卷

分爲兩種,

條件是或還是與(不符合一個就篩選出來還是全部不符合才篩選出來)

步驟:

  1. 複製要篩選的部分的列標題,粘貼(細節:和本來的數據之間至少隔3行)
  2. 寫條件
    1. 與(全部不符合才篩選出來):與條件寫在一行
    2. 或(不符合一個就篩選出來):不能寫在同一行
  3. 點擊高級篩選:將篩選結果複製到其他位置
    1. 列表區域:選擇的就是我們原數據區域的(所有原數據區域)
    2. 條件區域:點擊選擇我們寫的條件區域
    3. 複製到:指的是篩選結果複製到,點擊選擇一個單元格(因爲我們不知道我們的篩選結果到底有多少),注意和條件區域也最少隔3行

image-20200528224214456

避免錄入數據時超出有效範圍

  1. 選中要輸入數據的區域
  2. 點擊數據---->數據有效性(設置合適的數據有效性的允許值)
  3. 點擊來源------>選中我們數據的來源

這樣在數據錄入時,我們就只能輸入規定的數值

image-20200528224752562

同時還可以設置出錯警告來給出友好的提示信息.

對於"沒有手機’'和"有平均月費"的問題,

1.我們可以通過多次普通篩選(在篩選基礎上篩選)來得出結果

2.通過if函數標記處奇異值

=if(and(b2=2,F3<>""),“F”,""):表示的是如果B2的列的值爲2F3的列的值不爲空,就用F標記,否則用空標記

解決有邏輯錯誤的重複值(多項限選題的邏輯不一致性的解決靠函數)

如:你購買的原因1和購買原因2相同,就是邏輯錯誤的

也可以適用多重篩選來得到結果,但是如果答案的選項很多,就很複雜

我們同樣使用函數來解決這個問題

主要是學習or函數的使用

=IF(COUNT(C2:E2)<2,"",IF(OR(C2=D2,D2=E2,C2=E2),“F”,"")):

表示的含義是:從外層開始解釋

如果C2到E2的數小於2,即填寫的原因只填寫了1個,或者沒填寫,這時置空,否則:

判斷如果C2=D2,D2=E2,E2=C2中有一個符合就置爲"F",都不符合就置爲空

image-20200528231337430

篩選出重複的記錄

有的記錄是完全重複的記錄,我們需要將其刪除

image-20200528231802236

建立調查問卷的SPSS數據文件

  • 在變量視圖中建立變量充當問題,值填寫(選項)
  • 不同種類的問題,在SPSS中使用不同的策略,比如:
    • 單選題:直接在值中輸入不同選項的答案
    • 多項限選題:採用分類法,限選幾項就創建幾個變量,變量的值是所有的選項
    • 多項任意選:採用二分法,爲爲每一個選項創建一個變量,值可以是兩種,選中或者不選中(比如1代表選中而空代表未選中----這樣設置之後保存爲Excel文件時,打開文件空的地方會顯示#Null,這時可使用替換所有來把#Null替換爲空 ----操作:開始 ----查找替換)
  • 當創建錄入了SPSS文件時,這時我們就可以對SPSS文件進行保存和另存爲.SPSS文件的後綴是.sav

第4章單變量的一維頻率分析

  • 頻率分析是所有問卷調查中最廣泛使用的分析技巧
  • 因爲頻率分佈表的建表方式簡單,分析容易,閱讀容易
  • 基本統計分析往往從頻率分析開始
  • 通過頻率分析,能夠在一定程度上反映出樣本是否具有總體代表性,抽樣是否存在系統偏差
  • 頻率分析的基本任務:
    • 1.編制頻率分佈表
    • 2.繪製統計圖(最直接的數據刻畫方式)

利用SPSS對單選題進行一維頻率分析

分析菜單-------描述統計------頻率------具體操作

區分概念:

在SPSS中生成的頻率分佈表中有百分比,有效百分比,累計百分比

  • 頻數/問卷數===百分比
  • 頻數/有效問卷數(部分問卷可能對該問題沒有回答)===有效百分比 我們在調查報告中的百分比指的就是有效百分比
  • 累計百分比是根據我們分析的順序對百分比進行累加

利用Excel對單選題進行一維頻率分析(重點)

兩個步驟:

1.在Excel中,將SPSS格式的一維頻率分析錶轉換爲調查報告所需的格式

在已生成的SPSS的一維頻率分析表上單擊右鍵----複製------在Excel中粘貼

把我們需要的數據摘抄和進行數據格式的轉換(百分數)

image-20200530094528012

2.在Excel中根據頻率進行排名

1.圖形化操作

左鍵單擊選中要排序的數據列-----在數據選項卡------排序-----在

或者:

數據------排序------操作選擇要排序的列

2.使用函數進行排名(rank函數)

rank(參數1,參數2,參數3):進行排序的函數

  • 第一個參數:需要排序的單項列:如C2
  • 第二個參數:需要排序的列的範圍,如:C2:C8,爲了使用排序函數時排序區間不發生變化,這時我們要使用單元格的絕對引用方式------選中C2:C8按下F4將單元格變成$C2:2:C48
  • 第三個參數:排序時使用的排序順序0代表降序(默認),1代表升序排序

=RANK(C2,$C2:2:C$8,0):需要排序根據的是C2的列(單項),排序範圍是C2:C8,使用的排序方式是降序排列

image-20200530160440736

注意這種排序的方式使用的是:美式排序,如果有相同的排名就會頂替掉一些排名,如:1,2,2,4,5

COUNTIF(範圍(爲了範圍不發生變化,使用絕對引用),表達式)函數,統計函數:能夠統計在某一範圍中,表達式出現的次數

如:COUNTIF($B2:2:B$1001,E2)

image-20200530162229563

如何使用Word編輯一維頻率分佈表(重點)

在Excel中繪製一維頻率分佈統計圖(重點)

單選題的一維頻率統計圖可以是餅圖,柱形圖,條形圖,但是優選餅圖,因爲單選題的頻率之和爲100%

繪製單選題的一維頻率分佈圖餅圖

(1)選取要繪製餅圖的數據來源同時Ctrl選中數據對應的百分比

(2)插入-----餅圖

(3)可以修改圖表的標題名稱和字體大小

(4)不顯示圖例

(5)點擊餅圖-----佈局----數據標籤-----設置數據標籤格式(顯示類別名稱和值):選擇數據標籤外和按照分行符的格式來顯示

(6)設置圖表樣式—其中樣式26是立體的樣式

柱形圖和條形圖的繪製方法基本上和餅圖的方法相同

在Excel中繪製的圖表會和我們的數據相關聯,當我們的數據發生變化時,圖表的信息也會發生變化,可實現實時數據的可視化顯示

利用SPSS對填空題進行一維頻率分析

因爲填空題所填的數字(數值)的可能性很多,我們不能使用分類法來對所填的數據進行統計一維頻率分析,也不能使用二分法進行一維頻率分析.因此,我們需要先在SPSS中對數據進行分組和轉換.

轉換----------重新編碼爲不同的變量------具體操作

轉換後我們可能需要在變量視圖中對值的標籤中填充我們的值內容

然後點擊分析------一維頻率分析------選擇新編碼出來的變量進行分析

就可以得到分析出來的結果

image-20200530171648635

利用Excel對填空題進行一維頻率分析(重點)

image-20200530171720892

2.使用Excel計算學生的期末的最終成績

image-20200530215042106

計算百分總成績:=B220%+C2505+D2*30%

最終成績是使用了一個用於四捨五入的ROUND(範圍單列,保留小數位數):=ROUND(E2,0)

需要突出分數<60分的成績:開始------條件格式-------突出或新建規則------具體操作

完成最終的成績統計

image-20200530215652825

1.使用COUNTIF函數來做:符合條件就統計(可以用多條件來實現複合條件)

=COUNTIF(範圍,條件)

=COUNTIF($F2:2:F$69,"<=60")

使用多條件來實現複合條件的篩選

=COUNTIF($F2:2:F69,"<=90")COUNTIF(69,"<=90")-COUNTIF(F2:2:F$69," >=80")

需要注意條件要用雙引號括起來,範圍爲了拖動時不發生錯誤要使用絕對位置

2.使用COUNTIFS函數來做:符合複合條件就統計

=COUNTIFS($F2:2:F69,"<=90",69,"<=90",F2:2:F$6," >=80")

根據頻率排名

前面介紹過了RANK函數

撰寫調查報告

標題小三的字體大小(宋體)

正文小四的字體大小(宋體)

1.5倍行距(在段落中設置)

表例和圖例的字體大小一般比正文小一號字(一般爲五號字)

注意表例要在表的上方

圖例要在圖的下方

在word中我們的單詞可能會下面有紅線,找到審閱------拼寫和語法-----選擇忽略所有

在word中撰寫調查報告時插入的表格中列有表格對不齊的情況:選中對不齊的列,按下ALT鍵進行微調對準

在word中插入我們在Excel中製作好的統計圖時,我們選擇粘貼的方式如果是圖片,那麼在Excel中數據發生變化時,我們在word中插入的統計圖是不會發生變化的,但是默認的粘貼的方式是,粘貼爲圖形對象,就是在Excel中的數據發生變化,在word中的統計圖表也會發生變化

第5章雙變量的交叉表分析

市場調查民意調查,經常利用交叉表來分析兩個分類(定性)變量之間的關係,比如:性別與品牌偏好.教育程度(學歷)與使用品牌.收入與是否有數碼相機.性別與移動電話類型偏好.地區與移動電話類型偏好,等等

在SPSS中進行兩個單選題的交叉表分析

分析-------描述統計-------交叉表------選擇行----選擇列------單元格中百分比選擇行

要注意是描述的是誰和誰的關係的分析,性別與幸福感,則性別作爲交叉表的行變量

image-20200531115931874

然後將表複製到Exce中,進行簡單的處理

image-20200531120224885

然後使用Ctrl選中綠色和藍色來繪製圖表,我們在Excel中繪製圖表,不同的圖表的區別很大,我們首選繪製的是百分比堆積柱狀圖-------簇狀柱形圖-------簇狀條形圖

在Excel中繪製兩個單選題的交叉表統計圖

經過在SPSS中進行交叉表的分析和在Excel中對統計圖的簡單繪製我們得到了如下的結果

image-20200531120702205

接下來,我們需要調整圖表的系列

設計------切換行/列

將數據標籤顯示在圖表的內部:佈局------數據標籤----選擇數據標籤內

刪除網格線:單擊網格線,按下DEL鍵

設置座標軸格式:單擊選擇設置座標軸格式------座標軸選項----選擇固定填寫0.2

設置立體感:設計—樣式—選擇立體的樣式

設置一個圖表標題:佈局----圖表標題----圖表上方–輸入標題(修改字體大小)

最終效果:

image-20200531121823021

在Excel中利用數據透視表實現一維頻率分析和交叉表分析

在SPSS中使用數據透視表實現一維頻率分析

插入-----數據透視圖—選擇數據範圍----選擇放置數據透視表的位置(一般選擇新的工作表)

image-20200531130602287

關於數據透視表的操作:

概念:

  • 行標籤:行標籤
  • 列標籤:列標籤
  • 數值:選擇要添加到數據透視表的字段(BH)到數值就可以分析字段
    • BH表示計數項
    • 可選的BH的計算項類型:在計數項上單擊----選擇值字段設置:求和,求平均值,最大值,最小值,乘積計數等
    • 其中百分比的生成可以依靠在選擇字段設置時選擇計數再選擇值顯示方式中選擇佔同列數據綜合的百分比

image-20200531130956169

再對數據透視表進行操作:

複製篩選合適的數據,使用函數或者圖形化操作生成表格.

image-20200531131131942

根據表格就可以生成統計圖

image-20200531131207549

在SPSS中使用數據透視表實現雙變量交叉表分析

雙變量交叉表分析在Excel中分析就是在透視表中不僅有行標籤而且有列標籤,這樣就實現了行列雙變量,而數值就是實現的是對雙變量的交叉分析.

image-20200531132820387

第6章多選變量的一維頻率分析和交叉表分析

多選變量使用二分法進行一維頻率分析

多選變量:指的就是我們之前所遇到的那種多項不限選題多項限選題

我們要處理這些問題的數據,我們需要先在SPSS中對數據進行處理

我們這裏舉例說明一個多項不限選問題的一維頻率分析和交叉表分析

首先看一維頻率分析,對於多項不限選,現在SPSS中

  • 首先要將該問題的所有選項定義成一個變量集(不論是做一維頻率分析還是交叉表分析都需要先定義變量集)

    • 分析--------多重響應---------定義變量集---------把選項都拖進去----------要注意將變量轉化爲(如果我們的選項的處理方式是二分法(也就是我們的題目是多項不限選),就選擇二分法計數值填寫1,如果我們的問題是分類法處理的,我們就選擇類別,然後確定範圍[ ]到[ ])-------名稱寫我們變量集的名稱

    image-20200531182510588

  • 生成了我們的變量集之後:我們對多項不限選問題進行一維頻率分析

    • 分析-------參數響應------頻率----------具體操作
image-20200531183219971

注意變量的含義

  • N都表示的是回答的次數(選擇這個選項的次數)
  • 百分比是N回答次數(比如559)佔總回答次數(1108)的百分比
  • 個案百分比:該選項被選擇次數()559在總個案數(總回答人數,714)中所佔的百分比

這樣就在SPSS中生成了對多項不限選題的一維頻率分析

接下來就要把SPSS中的一維頻率分析的結果在Excel中轉化爲調查報告所需的格式.

image-20200531184351795

  • 排序可使用rank函數或者圖形化操作
  • 排名可以簡單生成:(就是在排序後,數字1然後簡單拖動),或者直接使用rank函數

接下來我們需要根據圖表對多項不限選題進行繪製統計圖

注意:多項不限選題目我們繪製統計圖時首先推薦繪製條形圖和柱形圖,而不能繪製餅圖,因爲我們的百分比超過了100%(我們需要分析的是個案百分比)

image-20200531185905639

格式調整之後:

image-20200531190129698

最後就可以在word中做調查報告

多選變量使用分類法進行一維頻率分析

多選變量使用分類法是多項限選題

對於使用分類法的多選題的一維頻率分析,我們

  • 先定義變量集(和使用二分法重新定義變量集的方式相同)
    • 需要注意的是將變量編碼爲選擇**類別:**然後填寫類別
  • 然後得到了頻率分析的結果,然後就在Excel中進行操作

SPSS中實現多選題的交叉表分析

  • 先查看要分析的交叉表的問題選項的最大值和最小值
  • 分析-------------多重響應----------交叉表------------選擇分析的行(這裏要填寫行的最大值和最小值)--------填寫列(列就是我們重新編碼的變量集)
  • 在選項中選擇:---------單元格百分比(選擇行)---------百分比基於(個案)

就得到了多選題的交叉表分析:

image-20200603082744369

然後將表格複製到Excel中進行操作

image-20200603082925998

複製後我們要重新構建表,技巧:原來的表頭是橫着排列的,我們需要其豎着排列.複製原表頭,選擇性粘貼中選擇轉置,對於其他的有橫豎轉換的粘貼,都可以使用到轉置的技巧

image-20200603084225198

在Excel中對多選變量進行一維頻率分析

在Excel中對多選變量使用分類法進行一維頻率分析

在Excel中要求能向下拖動而保證範圍不變,一般改變的是第二個參數,要保證橫向拖動而範圍不變,一般改變的是第一個參數

image-20200603085609951

在Excel實現二分法編碼多選題的一維頻率分析

image-20200603090604188

Excel中對使用分類法編碼多選變量的交叉表分析

Excel中對使用二分法編碼多選變量的交叉變分析

方法和分類法的方法相同.

第7章描述統計分析

描述統計分析

問卷回收後,對於數值型數據(定量數據),通常會以均值.中位數.衆數等統計量來描述其集中趨勢,也會以標準差.最小值.最大值.極差等統計量老描述其離散程度

均值

  • 描述的是統計量的集中趨勢
  • 樣本值的平均值.均值是度量數據集中趨勢的常用統計量.在參數估計及假設檢驗中經常用到

衆數

  • 統計學名詞,在統計分佈上具有明顯集中趨勢點的數值,代表數據的一般水平(衆數不存在或者多餘一個)
  • 當數值或觀察者沒有明顯的順序時,使用衆數很有用

在Excel中來統計衆數

  • x選中要求衆數的數據--------數據標題欄-----排序(升序降序無所謂,要求數據的衆數,先要對數據進行排序,才能便於我們進行分類彙總)
  • 數據標題欄---------分類彙總(對誰進行排序就對誰進行分類彙總)

image-20200604194036589

中位數

  • 一組數據排序後位於中間位置上的數
  • 中位數是用中間位置上的數值(求出均值)代表數據的集中趨勢,其特點是不易受極端值的影響,所以中位數均值穩健

在Excel中求中位數

注意

  1. 中位數在數據的個數是奇數和偶數時是不同的
  2. 在Excel中求中位數,我們數據得出的中位數的位置都需要加1纔是真實的數據位置,因爲我們的標題通常要佔據一行

image-20200604194959952

分析了在數據是偶數個和奇數個時求中位數的方法,得出了一個統一的方法是:(數據個數+1)/2

奇數個數據求中位數
  • 用到的函數:COUNT()函數,用於求出公式中的中位數的位置(非在Excel中真實的位置)
  • address()函數,需要三個參數
    • 第一個參數:表示行
    • 第二個參數:表示列
    • 第三個參數:表示數據是絕對引用還是混和引用
  • indirect(取數據的位置座標):用於取出數值代表的座標的數值

image-20200604200622823

圖中第二個函數寫錯了,應該是=ADDRESS(B13+1,2,4)

偶數個數據求中位數
  • 用到的函數:COUNT()函數,用於求出公式中的中位數的位置(非在Excel中真實的位置)爲了確切函數的位置我們在COUNT函數的外面嵌套int函數()
    • 例題中的函數爲=INT((COUNT(B2:B11)+1)/2)
  • 偶數中求具體的位置和數值的方法和奇數中一樣,這裏我們把函數進行一個嵌套,直接得出中位數的數值
    • 例題中求一箇中位數使用的函數爲:=INDIRECT(ADDRESS(B13+1,2,4))
    • 例題中求第二個中位數使用的函數爲:=INDIRECT(ADDRESS(B13+2,2,4))
  • 求出最終的中位數
    • 例題中最後一箇中位數使用的函數爲:=(B14+B15)/2

image-20200604201343064

不論數據的個數,直接求中位數

image-20200604202530590

這裏使用到了mod函數(範圍,對誰求餘數):求餘數函數

離散程度

離散程度描述的是數據散佈,即描述集中與離散程度的度量

一般來說,數據越分散,離散程度統計量的值越大

極差

  • 極端值之差.即一組數據的極大值和極小值之差,也稱全距
  • 因爲極差只是利用了一組數據兩端的信息,因而容易受極端值的影響,不能全面反映差異狀況

在Excel中求極差就是求出最大值和最小值然後求差.

用到的函數是max函數和min函數

標準差

  • 樣本中各個數值到均值的距離的一種平均
  • 標準差實際上的方差的平方根

s=1ni=0n(nixˉ)2 標準差s=\sqrt{\frac{1}{n}\sum_{i=0}^n(n_i-\bar{x})^2}

在Excel中求標準差

  • 求平均值的函數AVERACE(數據範圍)
    • 在例題中的函數爲:AVERACE(B2:B7)
  • 然後求離差的平方,(數據座標-均值數據座標)^2這裏的語法和markdown中求平方的語法很像
    • 在例題中的函數爲:=(B2-$B$10)^2這裏使用了座標的絕對引用是因爲我們需要拖動數據,爲了使列座標保持不變
  • 求方差:就是離差的平方求均值,AVERACE(數據範圍)
    • 在例題中的函數爲:=AVERACE(C2:C7)
  • 求標準差:數據座標^(1/2)
    • 在例題中的函數爲:=B11^(1/2)
    • 也可以使用函數sqrt(數據範圍):=sqrt(B11)

image-20200604213951004

方差

  • 各點到均值距離的平方的平均
  • 方差由於和數據的量綱不同,因而在實際應用中使用得不如標準差那麼普遍

s2=1ni=0n(nixˉ)2=(x1xˉ)2+(x2xˉ)2++(xnxˉ)2n s^2=\frac{1}{n}\sum_{i=0}^n(n_i-\bar{x})^2=\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2+\ldots+(x_n-\bar{x})^2}{n}

數據的標準得分

因爲評分標準不同導致的最終得分不同,那麼不同標準不同得分的數據怎麼進行比較呢?

就用到了數據的標準得分,數據標準化之後,再比較標準化之後的數據

  • 標準化的方法:把原始觀測值(亦稱得分,score)和均值之差除以標準差得到的度量稱爲標準得分(standard score):(x-m)/s(m表示均值,x表示原始數據,s表示標準差)

image-20200604214150142

分析標準化得分時要分別討論:

比如題中的得分85和得分73

85分的成績在1班的成績中屬於中等成績

73分的成績在2班的成績中屬於較高的成績

但是如果是同一份試卷,那麼85分的成績是高於得分74的成績的

利用SPSS實現定量變量的描述統計分析

分析------描述統計------描述------選項(添加要分析的項)-----選擇顯示順序(一般選擇按均值的升序排序)

image-20200604215103043

將描述統計結果複製到Excel中進行轉換和繪製統計圖

image-20200604215218105

轉換方式和繪圖方式在前面的章節中有具體的操作,這裏不做贅述.

利用SPSS實現定量變量的多組均值比較

多組均值意思就是在數據之前有不同的分類,比如醫院(私人醫院,公立醫院,學院醫院)在分類的情況下討論其他值的均值的關係,在本例中工作.工資,升職機會都是度量類型的數據.

在SPSS中操作

分析-----比較均值----均值-----自變量列表就是就是分類的變量-----而因變量的類型就是我們的定量變量(變量的類型是度量類型的變量)-------選項中選擇要分析的標準(一般爲個案數,標準差,均值)

image-20200604221736754

然後將在SPSS中的分析結果複製到Excel中進行數據的轉換和統計圖的繪製

image-20200604222043914

利用SPSS實現有序變量的描述統計分析

有序變量指的是:在統計的調查問卷中,我們有時會設置這樣的問題:比如你對某幾個方面的重要程度進行排序,假如說3個方面,1代表非常重要,2表示無所謂,3表示一點不重要.那麼這個變量就是有序變量,

有序變量問題我們在SPSS中把每個選項都使用的是分類法來進行變量的描述

現在我們就要討論對有序變量的描述統計分析

分析------描述統計------描述------把要分析的多個方面都添加到分析變量中-------選項(一般只選擇均值,並選擇按照均值的升序排序)

image-20200604223315896

然後將在SPSS中的分析結果複製到Excel中進行數據的轉換和統計圖的繪製

image-20200604223344209

然後進行調查報告的編寫(這裏截取了書中標準的模板,這個也是調查報告的標準模板)

image-20200604223502337

利用SPSS實現有序變量的多組均值比較

和多組定量變量同樣也就存在多組有序變量,意思就是在原本有序變量的基礎上加上了分組(或者稱爲分類)

分析-------比較均值---------均值-------添加類別變量到自變量菜單---------添加因變量(也就是那些我們要分析的定序變量)----------選項(這裏我們只分析均值,也可以添加上個案數)

image-20200604224310745

然後將在SPSS中的分析結果複製到Excel中進行數據的轉換和統計圖的繪製

這是最終結果

image-20200604224359238

我們在自己繪製統計圖時可能會因爲建表不同而導致和規定的圖表不同

這是我們要點擊設計-------切換行/列來轉換統計圖的行列的格式

image-20200604224809231

利用Excel"描述統計"分析工具實現矩陣題的統計分析描述

矩陣題:

多個題目都有同一分類度量的標準

數據選項卡----數據分析----描述統計--------選擇數據區域-----逐列分組-------選中標誌位於第一行-----選擇輸出區域(只能選取一個單元格)------選中彙總統計

image-20200604234859839

圖表進行處理

image-20200604234940327

排序(根據滿意度)

image-20200604235027326

繪製統計圖調整統計圖的格式

image-20200604235103155

最終結果

image-20200604234025696

我是一個普通二本的學生,可能寫的有不周到之處,希望各位大佬指點.讓我們一起努力,不過平庸的生活.
如果您感覺`我寫的不錯麻煩點個贊.

如果有什麼問題,可以留言我們一起探討
如果有什麼建議,也可以留言給我,我會虛心的接收,
最後謝謝您,看完了我的文章

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章