SPSS:基本統計分析(一)
統計科學分爲兩大部分:描述性統計和推斷性統計。
描述性統計提供了將原始數據整理成有用形式的方法,這些方法包括收集、整理、概況、描述及給出數據的信息。具體來講,這些方法包括將統計資料整理成表格的形式,圖形的形式,用平均數、中位數、衆數等度量集中趨勢,用極差、標準差、變異係數等度量離散程度。
1.頻數分析
基本的統計分析往往是由頻數分析開始的。通過頻數分析能夠了解變量取值的狀況,對把握數據的分佈特徵是非常有幫助的。
基本任務
編制頻數分佈表
SPSS中頻數分佈表包括的內容:
- 頻數:變量值落在某個區間(或某個類別)中的次數
- 百分比:各頻數佔總樣本量的白分比
- 有效百分比:各頻數佔有效樣本量的百分比(有效樣本量=總樣本量-缺失樣本量)
- 累計百分比:各百分比逐級累加的結果,最終取值爲100%
繪製統計圖
柱形圖、條形圖、餅圖、直方圖
相關概念
均值標準誤:是對樣本均值與總體均值之間平均差異程度地估計。
操作
2.計算基本描述統計量
基本描述統計量
刻畫集中趨勢的描述統計量
- 算數平均
- 中位數
- 衆數
- 調和均數
- 幾何均數
- 截尾均數
刻畫離散程度的描述統計量
- 樣本標準差
- 樣本方差
- 全距
- 變異係數
- 四分位數、四分位數間距、百分位數
刻畫分佈形態的描述統計量
數據的分佈形態主要指數據分佈是對稱、偏斜程度如何、分佈陡緩程度等。
-
偏度(Skewness)
樣本偏度係數:
偏態的方向指的應當是長尾的方向,而不是高峯的位置。
α=0,分佈爲對稱分佈
α<0,分佈爲負偏或左偏,即長尾巴在左邊,峯尖偏右
α>0,分佈爲正偏或右偏,即長尾巴在右邊,峯尖偏左 -
峯度(Kurtosis)
樣本的峯度係數:
β=0,分佈爲正態峯
β<0,分佈爲低峯度的,即形狀要比正態分佈的峯平坦
β>0,分佈爲高峯度的,即形狀要比正態分佈的峯陡峭,峯的形狀也比較尖
操作
數據的標準化
SPSS中的Descriptive過程可以將原變量轉換爲標準正態分佈的得分