回归分析及参数介绍


回归分析:

x变化一单位时,y平均变化多少

如果我们能够确定这条直线,我们就可以用直线的斜率来表示当x变化一单位时y的变化程度,由图中的点确定线的过程就是回归。


β1、β2为参数(parameters),或称回归系数(regressioncoefficients)

实际值与拟合值的差,记为u ,称为残差(residual)

模型拟合度评估:

  1. 拟合优度R2R2越大,说明回归线拟合程度越好;R2越小,说明回归线拟合程度越差。由上可知,通过考察R2的大小,我们就能粗略地看出回归线的优劣。范围为0到1之间
  2. 调整R2 :增加了一个解释变量以后,R2只会增大而不会减小。引入调整R2
  3. AIC信息准则(Akaikeinformation criterion),是衡量统计模型拟合优良性和模型复杂度的一种标准。注意这些规则只是刻画了用某个模型之后相对“真实模型”的信息损失。

自变量和因变量的相关性评估:

  1. P-value(P值或sig值):判断原始假设是否正确的重要证据,显著性水平。我要证明命题为真->证明该命题的否命题为假->在否命题的假设下,观察到小概率事件发生了->否命题被推翻->原命题为真->搞定。一般以P < 0.05 为显著, P <0.01 为非常显著。
  2. beta指的是贝塔系数:指的是自变量与因变量的相关性,数值为正就是正相关,负就是负相关.数字绝对值越大就是相关性越强.
  3. tstat统计值)这个自变量是否应该参与因变量的多元回归分析。t>1有一定影响,t>2影响重要,t<1无影响,可不参加回归。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章