機器學習(補充知識)之最小二乘法

個人學習筆記(歡迎交流指正): 

                                            最小二乘法

1.1 最小二乘法簡介

百度百科:最小二乘法(又稱最小平方法)是一種數學優化技術。它通過最小化誤差的平方和尋找數據的最佳函數匹配。利用最小二乘法可以簡便地求得未知的數據,並使得這些求得的數據與實際數據之間誤差的平方和爲最小。

下面以最簡單的一元線性迴歸模型來解釋最小二乘法的原理。

1.2 一元線性迴歸模型

(1)一元線性迴歸模型一般形式:

                                                                             f(x) = w*x + b

殘差形式爲:

                                                                             y_{i} = f(x_{i}) = w*x_{i} + b + e_{i}

                                                                            e_{i} = y_{i} - (w*x_{i} + b)

其中,e_{i} 爲樣本(x_{i}, y_{i})的誤差。

(2)平方損失函數:

  在訓練集 T = \left \{ \right.(x_{1}, y_{1}), (x_{2}, y_{2}), ..., (x_{N}, y_{N})\left. \right \}上, 模型平方損失函數爲:

                                                             L(f) = \sum_{i=1}^{N}e_{i}^{2} = \sum_{i = 1}^{N} (\hat{y}_{i} - y_{i})^{2} = \sum_{i = 1}^{N} (w * x_{i} + b - y_{i})^{2}

1.3 最小二乘法求解

爲了使求出的迴歸模型能夠儘可能好的擬合訓練樣本,這條直線處於樣本數據的中心位置最合理。選擇最佳擬合曲線的標準可以確定爲:使總的擬合誤差(即總殘差)達到最小。有以下三個標準可以選擇:

        (1)用“殘差和最小”確定直線位置是一個途徑。但很快發現計算“殘差和”存在相互抵消的問題(有正有負)。
        (2)用“殘差絕對值和最小”確定直線位置也是一個途徑。但絕對值的計算比較麻煩(還是要判斷正負)。
        (3)最小二乘法的原則是以“殘差平方和最小”確定直線位置。用最小二乘法除了計算比較方便外,得到的估計量還具有優良特性,這種方法對異常值非常敏感。(利用平方誤差函數作爲最優函數求解其實源自極大似然估計,有興趣可以自己查一下相關數學背景)

以普通最小二乘法爲例,使L(f)最小來確定直線,L(f)可以看做是 w 和 b 的函數,問題轉化爲極值問題:

L(f)w 和 b 的偏導數:

                                                              \frac{\partial L}{\partial w} =2\sum_{i=1}^{N}[(wx_{i}+ b - y_{i}) * x_{i}] = 0

                                                              \frac{\partial L}{\partial b} =2\sum_{i=1}^{N}[(wx_{i}+ b - y_{i})] = 0

 

求得:

                                                             w = \frac{N\sum_{i = 1}^{N}x_{i}y_{i} - \sum_{i=1}^{N}x_{i}\sum_{i=1}^{N}y_{i}}{N\sum_{i=1}^{N}x_{i}^{2} - (\sum_{i=1}^{N}x_{i})^{2}}

                                                             b = \frac{\sum_{i = 1}^{N}x_{i}^{2}\sum_{i=1}^{N}y_{i} - \sum_{i=1}^{N}x_{i}\sum_{i=1}^{N}x_{i}y_{i}}{N\sum_{i=1}^{N}x_{i}^{2} - (\sum_{i=1}^{N}x_{i})^{2}}

1.4 最小二乘法矩陣形式推廣

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章