第五章 線性迴歸
對於一個給定的數據集,我們想用線性迴歸來進行預測
fitted.regression <- lm(y~x,datasource)接下來要進行直線的位置參數的求解
[intercept slope] = ceof(fitted.regression)求解出直線以後,要對我們求出的直線進行評估,主要通過殘差平方和
errors <- residuals(fitted.regression)
squred.errors <- errors ^ 2但是殘差平方和會受到數據集大小的影響,所以使用殘差平方和的均值MSE
mse <- mean(squared.errors)然而平均偏離量較大時,還是會把這種偏離的影響擴大,因爲是先求了平方再求得均值,所以用均方誤差 RSME
rsme <- sqrt(mse)但是我們沒有一個標準說RSME到多大是不好的,所以我們R^2來解決
r2 <- 1- (model.rmse/mean.rmse)