迴歸分析及參數介紹


迴歸分析:

x變化一單位時,y平均變化多少

如果我們能夠確定這條直線,我們就可以用直線的斜率來表示當x變化一單位時y的變化程度,由圖中的點確定線的過程就是迴歸。


β1、β2爲參數(parameters),或稱迴歸係數(regressioncoefficients)

實際值與擬合值的差,記爲u ,稱爲殘差(residual)

模型擬合度評估:

  1. 擬合優度R2R2越大,說明迴歸線擬合程度越好;R2越小,說明迴歸線擬合程度越差。由上可知,通過考察R2的大小,我們就能粗略地看出迴歸線的優劣。範圍爲0到1之間
  2. 調整R2 :增加了一個解釋變量以後,R2只會增大而不會減小。引入調整R2
  3. AIC信息準則(Akaikeinformation criterion),是衡量統計模型擬合優良性和模型複雜度的一種標準。注意這些規則只是刻畫了用某個模型之後相對“真實模型”的信息損失。

自變量和因變量的相關性評估:

  1. P-value(P值或sig值):判斷原始假設是否正確的重要證據,顯著性水平。我要證明命題爲真->證明該命題的否命題爲假->在否命題的假設下,觀察到小概率事件發生了->否命題被推翻->原命題爲真->搞定。一般以P < 0.05 爲顯著, P <0.01 爲非常顯著。
  2. beta指的是貝塔係數:指的是自變量與因變量的相關性,數值爲正就是正相關,負就是負相關.數字絕對值越大就是相關性越強.
  3. tstat統計值)這個自變量是否應該參與因變量的多元迴歸分析。t>1有一定影響,t>2影響重要,t<1無影響,可不參加迴歸。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章