統計學習之方差分析

零、案例說明

爲了檢驗某小學六年級教學質量的差異,從該小學六年級的三個班級中分別選取一定數量的學生,分成三個組(三個樣本),對他們期末考試的平均分進行統計分析。如果實驗顯示每個每組的均值相同,即三個班期末考試的成績差異不大,則表明該小學六年級不同班級的教學質量沒有差異,and vice versa。

每個樣本組的平均分分別爲 \m{\mu _{1}}^{},\m{\mu _{2}}^{}\m{\mu _{3}}^{}方差分別爲 \m{\sigma _{1}}^{2},\m{\sigma _{2}}^{2},\m{\sigma _{3}}^{2}

給出零假設 ^{{H_{0}}^{}}\m{\mu _{1}}^{}=\m{\mu _{2}}^{} =\m{\mu _{3}}^{}

備擇假設 ^{{H_{1}}^{}} :樣本組的均值不全相等

方差分析將會依據觀測數據判定假設是否成立。

進行方差分析有3個假定條件:

  1. 每個樣本的值服從正態分佈
  2. 每個樣本的方差 ^{{\sigma _{}}^{2}} 相同
  3. 每個樣本中的個體相互獨立

假定零假設正確,\m{\mu _{1}}^{}=\m{\mu _{2}}^{} =\m{\mu _{3}}^{} ,三個樣本均值相等,同時根據假定條件中的2:樣本的方差相同,是不是可以看成——三個樣本均取自均值 \m{\mu _{1}}^{}=\m{\mu _{2}}^{} =\m{\mu _{3}}^{} ,方差爲 ^{{\sigma _{}}^{2}} 的同一總體。

方差分析的核心是中心極限定理。

從均值爲 \mu ,方差爲 ^{{\sigma _{}}^{2}} 的總體中抽取樣本容量爲 n 的樣本組,每個樣本組的均值服從均值 \bar{x} = \mu ,方差 \sigma _{\bar{x}}^{2} = \sigma ^{2} /n 的正態分佈。(中心極限定理)

這裏需要澄清樣本和總體的概念:總體有三個,分別是三個班級的所有學生,從三個總體中分別抽取出樣本容量爲n的三個集合,是我們所謂的樣本。如下圖

經過觀測,如果樣本的均值差異較大,可以推出,每個總體的均值不同;如果樣本均值相等,每個總體的均值可能很接近。

這裏的一個隱含推理就是:三個樣本來自同一總體,即將整個六年級看做一個整體,不存在班級差異。這樣,在抽取的樣本量相同的假定條件下,抽樣符合中心極限定理。可以推測樣本均值的分佈符合正態分佈,在某一區間內的概率會大。

正態分佈曲線

若 \bg_white ^{{H_{0}}^{}}成立,我們所得的三個班級是這個曲線上的某三個點,正態分佈的均值是三個樣本的均值的平均數,即 \mu = \sum_{i}^{k} \mu _{i}/k

正態分佈的方差可用如下公式進行估計

三個樣本來自不同總體

\bar{x} 有三個不同的分佈。如果將三個班看做一個總體,則總體的方差也會更大,總體的方差可用三個樣本方差的均值來估計:

^{{\sigma _{}}^{2}} = \sum_{i}^{k} _{\sigma }^{2} /k ,稱爲 ^{{\sigma _{}}^{2}} 的組內估計。

應用

給定顯著性水平 \alpha ,F分佈對應的臨界值爲 F_{a} ,當 F = \frac{MSTR}{(MSE))} > F_{a} 時,拒絕 H_{0}

一、什麼是方差分析?(方差分析的定義)

方差分析(Analysis of Variance,簡稱ANOVA),又稱“變異數分析”,是R.A.Fisher發明的,用於兩個及兩個以上樣本均數差別的顯著性檢驗。 由於各種因素的影響,研究所得的數據呈現波動狀。造成波動的原因可分成兩類,一是不可控的隨機因素,另一是研究中施加的對結果形成影響的可控因素。

1、基本概念:因子、水平 

方差分析(analysis of variance,ANOVA)是分析類別變量對數值因變量影響的一種統計方,其中類別變量稱爲因子,類別變量的值稱爲處理或水平。接受處理的對象或實體稱爲實驗單元,方差分析的原理:通過對數據誤差的分析來判斷類別自變量對數值因變量的影響效果是否顯著。

2、方差分析分類:單因素方差分析、雙因素方差分析、協方差分析

單因素方差分析

線性模型:y_{ij} = \mu _{i} + \varepsilon _{ij}其中 y_{ij} 表示第i個處理的第j個觀察值; \mu _{i} 表示第i個處理的平均值, \varepsilon _{ij} 表示第i個處理的第j個觀察值的隨機誤差。

然後根據統計量F計算出P值,與置信水平做出判斷。

雙因素方差分析

雙因子方差分析只從與單因子方差分析不同的角度,簡單描述:模型較複雜:(是否考慮交互效應r可分爲兩種情況)

考慮交互效應的誤差分解
考慮交互效應的誤差分解

 

考慮交互效應的雙因子方差分析表

 

協方差分析

協方差分析亦稱“共變量(數)分析”。方差分析的引申和擴大。基本原理是將線性迴歸與方差分析結合起來,調整各組平均數和 F 檢驗的實驗誤差項,檢驗兩個或多個調整平均數有無顯著差異,以便控制在實驗中影響實驗效應(因變量)而無法人爲控制的協變量(與因變量有密切迴歸關係的變量)在方差分析中的影響。例如,在研究某種教學方法(實驗變量)對學業成績(實驗效應)的影響時,被試的原有知識基礎同時影響學業成績,但往往在實驗中難以選取具備相同知識基礎的被試參加實驗,可用協方差分析從學業成績的總變異中將歸因於被試知識基礎差異的部分劃分出去,便於確切地分析教學方法對學業成績的影響,其中被試的知識基礎就是協變量

二、爲什麼需要方差分析?

三、方差分析有哪些應用?

方差分析在工業、農業、經濟、生物、醫學等領域的很多實際問題都可以用方差分析來解決,方差分析模型作爲一種重要的線性模型,具有巨大的研究意義。隨着經濟科學的快速發展,方差分析在各行各業扮演重要角色

四、參考文獻

  1. 百度百科-方差分析
  2. 案例說明-林橘子
  3. 方差分析:單因子和雙因子-herain
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章