方差分析基本原理
樣本要求
- 獨立性
各樣本必須是相互獨立的隨機樣本
樣本含量儘可能相等或相差不大 - 可比性
樣本均值不相同,可比較 - 正態性
樣本的總體符合正態分佈,偏態分佈不適用於方差分析。
對偏態分佈應考慮用對數轉換、平方根變換、倒數變換、平方根反正弦變換等變量變換方法變爲正態或接近正態分佈後再進行方差分析 - 方差齊性
各組樣本具有相同的方差
基本原理
由於各種因素的影響,方差分析研究的數據呈現波動性。造成波動的原因可分爲兩類:一是不可控的隨機因素;二是研究中施加的對結果形成影響的可控因素
方差分析若拒絕原假設,只能說明多個樣本總體均數不相等或不全相等。若要得到各組均數之間詳細信息,應在方差分析的基礎之上進行多個樣本均值的兩兩比較
產生總變異的原因有兩方面
同一處理不同重複觀測值的差異是由偶然因素影響造成的,即試驗誤差,又稱組內變異
不同處理之間平均數的差異主要是由處理的不同效應造成的,稱處理間變異,又稱組間變異
因此:總變異可分解爲組間變異和組內變異兩部分
圖解總變異=組間變異+組內變異
當選擇樣本時,樣本儘量接近總體均值,效果越好,我們希望樣本的組內變異越小越好,組間變異越大越好。
通過檢驗組間變異和組內變異之比,可以判斷是否組間變異起到決定性的因素
ANOVA分析的流程
單因素方差分析
簡介
如上圖ANOVA分析的流程,
- 單因素方差分析針對多組均數間的比較。
- 方差分析拒絕H0,只能說明多個樣本總體均數不相等或不全相等。若要得到各組均數間更詳細的信息,應在方差分析的基礎上進行多個樣本均數的兩兩比較。
- 兩兩比較分爲事前計劃好的比較和事後比較,前者藉助於對比(Contrast),後者藉助於兩兩比較(Post Hoc )提供的許多方法。
- 在分組變量包含次序信息時,如果方差分析做出了各組間差異有統計學意義的結論,並且Means-Plot均數圖提示各組均數的某種趨勢時,可以利用趨勢分析討論觀察值與分組變量取值間的數量依存關係。藉助於對比(Contrast)完成。
爲什麼不用獨立樣本t檢驗
多次採用獨立樣本t檢驗,會導致拒絕原假設的概率增大。例如t檢驗的顯著水平是0.05,N次t檢驗的顯著水平爲1-0.95**N,明顯比0.05大得多
數學模型
模型簡介
詳細證明
注意:這裏可以看到樣本要求假設如果作用於數學建模。
定義隨機誤差模型
不同水平條件下重複試驗結果
構建數學模型
參數估計
分解定理與自由度
顯著性檢驗
單因素方差分析表
菜單
數據源 salesperformance.sav
變量選擇設置
對比
多項式: 用於組間均數變化的趨勢檢驗
度:對趨勢分析指定多項式的形式
有時候爲了考察因變量與處理因素之間是否存在着某種依存關係,可以利用線性模型的有關原理對數據作進一步的分析,以統計學上稱爲趨勢(線性或者多項式關係)檢驗(Trend Analysis)。
可以選擇選項中的均數圖,可以直觀地揭示趨勢關係。
舉個例子:
係數:精確定義均值比較的多項式係數
多重比較實際上等價於均數的線性組合的假設檢驗。常用於實現計劃好的比較,即事先知道每組樣本的均值的線性關係。
舉個例子:
兩兩比較
如果事先並不知道樣本均值的線性關係,接受原假設後,需要進一步分析兩兩樣本均值的顯著性差異。
假定方差齊性
- LSD法
即最小顯著差法(Least Significance Difference Method),是最簡單的比較方法之一。
用t檢驗完成各組均值間的配對比較,對多重比較誤差率不進行校正。 - Sidak法
實際上是Sidak校正在LSD法上的應用。
用t檢驗完成各組均值間的配對比較,對多重比較誤差率進行校正。
Sidak法比LSD法保守得多。 - Bonferroni法
實際上是Bonferroni校正在LSD法上的應用
用t檢驗完成各組均值間的配對比較,對多重比較誤差率進行校正
Bonferroni法比Sidak法保守一些。 - Scheffe法
對多組均數間的線性組合是否爲0進行檢驗,即(Contrast) - Dunnett法
常用於多個實驗組與一個對照組間的比較
設定此法後,激活Control Category 參數框,展開小菜單,選擇對照組。
未假定方差齊性
- Tamhane’s T2 基於 t 檢驗的保守成對比較。當方差不相等時,適合使用此檢驗。
- Dunnett’s T3 基於學生化最大值模數的成對比較檢驗。當方差不相等時,適合使用此檢驗。
- Games-Howell 當方差不相等時的一種比較靈活的配對比較。
- Dunnett’s C 基於學生化範圍的成對比較檢驗。當方差不相等時,適合使用此檢驗。
兩兩比較方法的選擇策略
- 多個實驗組與一個對照組的比較,一般採用Dunnett法。
- 需要進行任意兩組間的比較而各組樣本含量相同,選用Tukey法。
- 需要進行任意兩組間的比較而各組樣本含量不相同,選用Scheffe法。
選項
- 描述性 描述性統計量
- 固定和隨機效果
固定效應模式和隨機效應模式的相關統計量 - 方差同質性檢驗
方差齊次檢驗結果 - Brown-Forsythe
https://en.wikipedia.org/wiki/Brown%E2%80%93Forsythe_test
http://www.real-statistics.com/one-way-analysis-of-variance-anova/brown-forsythe-f-test/
檢驗各組均值是否相等的統計量
Brown-Forsythe檢驗是指採用Brown-Forsythe分佈的統計量進行的各組均值是否相等的檢驗。Brown-Forsythe分佈也近似於F分佈,但採用Brown-Forsythe檢驗對方差齊性也沒有要求,所以當因變量的分佈不滿足方差齊性的要求時,採用Brown-Forsythe檢驗比方差分析更穩妥。 - Welch
http://www.real-statistics.com/one-way-analysis-of-variance-anova/welchs-procedure/
檢驗各組均值是否相等的統計量
Welch檢驗是指採用Welch分佈的統計量進行的各組均值是否相等的檢驗。Welch分佈近似於F分佈,採用Welch檢驗對方差齊性沒有要求,所以當因變量的分佈不滿足方差齊性的要求時,採用Welch檢驗比方差分析更穩妥。
結果分析
0.014 < 0.05 說明各組的方差沒有齊性,方差不等;這種情況適合於Welch / Brown-Forsythe檢驗
F統計量顯著性Sig < 0.05,說明均值不等
通過漸近F分佈,Sig < 0.05,說明均值不等
可以看到未標星的爲 2組和3組,說明2組和3組沒有顯著性差異
可以看到因子和因變量的趨勢,第一組得分最低,第二組和第三組的分值差距不大,可以多重比較的結果非常一致。