機器學習（補充知識）之最小二乘法

原創

2020-06-01 22:07

個人學習筆記(歡迎交流指正):

最小二乘法

1.1 最小二乘法簡介

百度百科：最小二乘法（又稱最小平方法）是一種數學優化技術。它通過最小化誤差的平方和尋找數據的最佳函數匹配。利用最小二乘法可以簡便地求得未知的數據，並使得這些求得的數據與實際數據之間誤差的平方和爲最小。

下面以最簡單的一元線性迴歸模型來解釋最小二乘法的原理。

1.2 一元線性迴歸模型

（1）一元線性迴歸模型一般形式：

殘差形式爲：

$y_{i} = f(x_{i}) = w*x_{i} + b + e_{i}$

$e_{i} = y_{i} - (w*x_{i} + b)$

其中， $e_{i}$ 爲樣本（ $x_{i}, y_{i}$ ）的誤差。

（2）平方損失函數：

在訓練集 $T = \left \{ \right.(x_{1}, y_{1}), (x_{2}, y_{2}), ..., (x_{N}, y_{N})\left. \right \}$ 上, 模型平方損失函數爲:

$L(f) = \sum_{i=1}^{N}e_{i}^{2} = \sum_{i = 1}^{N} (\hat{y}_{i} - y_{i})^{2} = \sum_{i = 1}^{N} (w * x_{i} + b - y_{i})^{2}$

1.3 最小二乘法求解

爲了使求出的迴歸模型能夠儘可能好的擬合訓練樣本，這條直線處於樣本數據的中心位置最合理。選擇最佳擬合曲線的標準可以確定爲：使總的擬合誤差（即總殘差）達到最小。有以下三個標準可以選擇：

        （1）用“殘差和最小”確定直線位置是一個途徑。但很快發現計算“殘差和”存在相互抵消的問題（有正有負）。
        （2）用“殘差絕對值和最小”確定直線位置也是一個途徑。但絕對值的計算比較麻煩（還是要判斷正負）。
        （3）最小二乘法的原則是以“殘差平方和最小”確定直線位置。用最小二乘法除了計算比較方便外，得到的估計量還具有優良特性，這種方法對異常值非常敏感。（利用平方誤差函數作爲最優函數求解其實源自極大似然估計，有興趣可以自己查一下相關數學背景）

以普通最小二乘法爲例，使最小來確定直線，可以看做是和的函數，問題轉化爲極值問題：

求對和的偏導數：

$\frac{\partial L}{\partial w} =2\sum_{i=1}^{N}[(wx_{i}+ b - y_{i}) * x_{i}] = 0$

$\frac{\partial L}{\partial b} =2\sum_{i=1}^{N}[(wx_{i}+ b - y_{i})] = 0$

求得：

$w = \frac{N\sum_{i = 1}^{N}x_{i}y_{i} - \sum_{i=1}^{N}x_{i}\sum_{i=1}^{N}y_{i}}{N\sum_{i=1}^{N}x_{i}^{2} - (\sum_{i=1}^{N}x_{i})^{2}}$

$b = \frac{\sum_{i = 1}^{N}x_{i}^{2}\sum_{i=1}^{N}y_{i} - \sum_{i=1}^{N}x_{i}\sum_{i=1}^{N}x_{i}y_{i}}{N\sum_{i=1}^{N}x_{i}^{2} - (\sum_{i=1}^{N}x_{i})^{2}}$

1.4 最小二乘法矩陣形式推廣

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器學習（補充知識）之最小二乘法

最小二乘法

1.1 最小二乘法簡介

1.2 一元線性迴歸模型

1.3 最小二乘法求解

1.4 最小二乘法矩陣形式推廣

C語言--右移左移

12款高效開源Wiki系統推薦，打造團隊知識管理利器

一個開源且全面的C#算法實戰教程

dotnet 基於 DirectML 控制檯運行 Phi-3 模型

自定義MyBatis插件

一款.NET開源、功能強大、跨平臺的繪圖庫 - OxyPlot

常用的 Git 指令

鼠標控制軟件有可能和虛擬機軟件產生衝突

sm4加密工具類

從零開始手寫VIO第三期作業總結(僅供參考)

機器學習（補充知識）之最小二乘法

slam入門3：2D-2D對極幾何中的對極約束公式詳細解釋（參考視覺slam十四講）

Bug: NvRmPrivGetChipPlatform: Could not read platform information

笑對爛代碼

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結