迴歸分析:
x變化一單位時,y平均變化多少
如果我們能夠確定這條直線,我們就可以用直線的斜率來表示當x變化一單位時y的變化程度,由圖中的點確定線的過程就是迴歸。
β1、β2爲參數(parameters),或稱迴歸係數(regressioncoefficients)
實際值與擬合值的差,記爲u ,稱爲殘差(residual)模型擬合度評估:
- 擬合優度R2:R2越大,說明迴歸線擬合程度越好;R2越小,說明迴歸線擬合程度越差。由上可知,通過考察R2的大小,我們就能粗略地看出迴歸線的優劣。範圍爲0到1之間
- 調整R2 :增加了一個解釋變量以後,R2只會增大而不會減小。引入調整R2 。
- AIC信息準則(Akaikeinformation criterion),是衡量統計模型擬合優良性和模型複雜度的一種標準。注意這些規則只是刻畫了用某個模型之後相對“真實模型”的信息損失。
自變量和因變量的相關性評估:
- P-value(P值或sig值):判斷原始假設是否正確的重要證據,顯著性水平。我要證明命題爲真->證明該命題的否命題爲假->在否命題的假設下,觀察到小概率事件發生了->否命題被推翻->原命題爲真->搞定。一般以P < 0.05 爲顯著, P <0.01 爲非常顯著。
- beta指的是貝塔係數:指的是自變量與因變量的相關性,數值爲正就是正相關,負就是負相關.數字絕對值越大就是相關性越強.
- tsta(t統計值)這個自變量是否應該參與因變量的多元迴歸分析。t>1有一定影響,t>2影響重要,t<1無影響,可不參加迴歸。