SPSS——基本的統計概念

SPSS——基本的統計概念

總體和樣本

總體和個體

研究對象的全體成爲總體,一般地把我們關心的隨機變量X成爲總體。組成總體的每個單元稱爲個體。個體也可理解爲總體X的取值

簡單隨機抽樣

爲了使抽樣具有充分的代表性,要求

  • 每個個體被抽到的機會均等
  • 每次抽取都是獨立的(共抽取n次)

通常的抽樣都是無放回的,當總體很大的時,可以滿足獨立性

樣本

總體是指考察的對象的全體, 個體是總體中的每一個考察的對象, 樣本是總體中所抽取的一部分個體, 而樣本容量則是指樣本中個體的數目。

在總體中抽取n個個體,成爲總體上的一個樣本,記爲(X1, X2, …, Xn),其中每次抽樣Xi(i=1,2,3..,n)也都是隨機變量,共n個隨機變量,加上括號,表示樣本是一個整體

獨立同分布

在概率統計理論中,如果變量序列或者其他隨機變量有相同的概率分佈,並且互相獨立,那麼這些隨機變量是獨立同分布。

隨機變量X1和X2獨立,是指X1的取值不影響X2的取值,X2的取值也不影響X1的取值.隨機變量X1和X2同分布,意味着X1和X2具有相同的分佈形狀和相同的分佈參數,對離散隨機變量具有相同的分佈律,對連續隨機變量具有相同的概率密度函數,有着相同的分佈函數,相同的期望、方差。反之,若隨機變量X1和X2是同類型分佈,且分佈參數完全相同,則X1和X2完全一定同分布!

如實驗條件保持不變,一系列的拋硬幣的正反面結果是獨立同分布。

隨機變量

隨機變量(random variable)表示隨機試驗各種結果的實值單值函數。

一個隨機試驗可能結果(稱爲基本事件)的全體組成一個基本空間Ω。隨機變量X是定義在基本空間Ω上的取值爲實數的函數,即基本空間Ω中每一個點,也就是每個基本事件都有實軸上的點與之對應。例如,隨機投擲一枚硬幣,可能的結果有正面朝上 ,反面朝上兩種 ,若定義X爲投擲一枚硬幣時朝上的面 , 則X爲一隨機變量,當正面朝上時,X取值1;當反面朝上時,X取值0。又如,擲一顆骰子,它的所有可能結果是出現1點、2點、3點、4點、5點和6點 ,若定義X爲擲一顆骰子時出現的點數,則X爲一隨機變量,出現1,2,3,4,5,6點時X分別取值1,2,3,4,5,6。

這裏寫圖片描述

統計量

統計量是含有樣本X1, X2, …, Xn的一個數學表達式,並且表達式中不包含未知參數,因此可以在得到樣本後計算出它的數值。

在抽樣之前,統計量的值無法確定,抽樣測試後,可以觀察到它的取值,因此統計量是隨機變量,是由樣本派生出來的隨機變量。

樣本均值

均值描述的是樣本集合的中間點,它告訴我們的信息是很有限的

這裏寫圖片描述

樣本標準差

標準差給我們描述的則是樣本集合的各個樣本點到均值的距離之平均。以這兩個集合爲例,[0,8,12,20]和[8,9,11,12],兩個集合的均值都是10,但顯然兩個集合差別是很大的,計算兩者的標準差,前者是8.3,後者是1.8,顯然後者較爲集中,故其標準差小一些,標準差描述的就是這種“散佈度”。之所以除以n-1而不是除以n,是因爲這樣能使我們以較小的樣本集更好的逼近總體的標準差,即統計上所謂的“無偏估計

我們知道,樣本量越大越能反映真實的情況,而算數均值卻完全忽略了這個問題,對此統計學上早有考慮,在統計學中樣本的均差多是除以自由度(n-1),它是意思是樣本能自由選擇的程度。當選到只剩一個時,它不可能再有自由了,所以自由度是n-1。

n-1中的-1就是爲了在考慮樣本標準差自由度上做的一個調配係數,既定爲1,,假設計算的標準差所對應的數據列只有1個數據,則1-1=0,不存在標準差,,以此證明-1爲調配係數,,所及請記住一般算標準差是,,都是算樣本數據的標準差,即:(n-1分之 各個數據與平均數差值的平方和)的2次方根。

這裏寫圖片描述

樣本方差

方差則僅僅是標準差的平方。

即樣本方差計算公式裏分母爲n-1的目的是爲了讓方差的估計是無偏的。無偏的估計(unbiased estimator)比有偏估計(biased estimator)更好是符合直覺的

這裏寫圖片描述

協方差

這裏寫圖片描述

協方差矩陣

這裏寫圖片描述

發佈了110 篇原創文章 · 獲贊 91 · 訪問量 86萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章