可汗學院:統計學第四次學習

統計學第四次學習
線性迴歸
在統計學中,線性迴歸(Linear Regression)是利用稱爲線性迴歸方程的最小平方函數對一個或多個自變量和因變量之間關係進行建模的一種迴歸分析。這種函數是一個或多個稱爲迴歸係數的模型參數的線性組合。只有一個自變量的情況稱爲簡單迴歸,大於一個自變量情況的叫做多元迴歸。
卡方分佈
若n個相互獨立的隨機變量ξ₁,ξ₂,…,ξn ,均服從標準正態分佈(也稱獨立同分佈於標準正態分佈),則這n個服從標準正態分佈的隨機變量的平方和構成一新的隨機變量,其分佈規律稱爲卡方分佈(chi-square distribution)。
性質:1) 分佈在第一象限內,卡方值都是正值,呈正偏態(右偏態),隨着參數 的增大, 分佈趨近於正態分佈;卡方分佈密度曲線下的面積都是1.
2) 分佈的均值與方差可以看出,隨着自由度 的增大,χ2分佈向正無窮方向延伸(因爲均值 越來越大),分佈曲線也越來越低闊(因爲方差 越來越大)。
3)不同的自由度決定不同的卡方分佈,自由度越小,分佈越偏斜。
方差分析
定義:
方差分析(ANOVA)又稱“變異數分析”或“F檢驗”,是由R.A.Fister發明的,用於兩個及兩個以上樣本均數差別的顯著性檢驗。
原理:
方差分析的基本原理是認爲不同處理組的均數間的差別基本來源有兩個:
(1) 實驗條件,即不同的處理造成的差異,稱爲組間差異。用變量在各組的均值與總均值之偏差平方和的總和表示,記作SSb,組間自由度dfb。
(2) 隨機誤差,如測量誤差造成的差異或個體間的差異,稱爲組內差異,用變量在各組的均值與該組內變量值之偏差平方和的總和表示, 記作SSw,組內自由度dfw。
總偏差平方和 SSt = SSb + SSw。
組內SSw、組間SSb除以各自的自由度(組內dfw =n-m,組間dfb=m-1,其中n爲樣本總數,m爲組數),得到其均方MSw和MSb,一種情況是處理沒有作用,即各組樣本均來自同一總體,MSb/MSw≈1。另一種情況是處理確實有作用,組間均方是由於誤差與不同處理共同導致的結果,即各樣本來自不同總體。那麼,MSb>>MSw(遠遠大於)。
MSb/MSw比值構成F分佈。用F值與其臨界值比較,推斷各樣本是否來自相同的總體 。
方差分析的基本思想是:通過分析研究不同來源的變異對總變異的貢獻大小,從而確定可控因素對研究結果影響力的大小。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章