線性模型——《機器學習》
@(《機器學習》西瓜書)
線性模型的基本形式:
給定由d個屬性描述的示例
寫成向量形式:
線性模型的表示就是如上:
均方誤差就是平方損失,就是求f(x)和y之間的歐氏距離。
一元線性迴歸求解
所以,
均方誤差幾何意義就是求歐氏距離,求解均方誤差一般是使用最小二乘法,就是試圖找到一條直線使得所有樣本到直線距離最小。
求解
分別使誤差函數對
多元線性迴歸
在解決實際問題時,使用一個特徵擬合問題模型基本不可能,需要增加多個特徵,這裏就需要使用多元線性模型。
此時將
此時:
當
scikit-learn中線性模型接口:
import numpy as np
from sklearn import datasets
from sklearn import linear_model
diabetes = datasets.load_diabetes()
diabetes_X_train = diabetes.data[:-20]
diabetes_X_test = diabetes.data[-20:]
diabetes_y_train = diabetes.target[:-20]
diabetes_y_test = diabetes.target[-20:]
regr=linear_model.LinearRegression()
regr.fit(diabetes_X_train,diabetes_y_train)
print(regr.coef_)
scikit-learn中提供了正則化方法來放置過擬合,嶺迴歸(Ridge Regression)就是正則化的一種方法。scikit-learn Linear Model
有關機器學習中線性迴歸詳解可參考這一篇Python 機器學習系列之線性迴歸篇深度詳細