機器學習系列之最小二乘法

原創

2020-06-20 23:43

最小二乘法

最小二乘法，又稱最小平方法，是機器學習中基礎的算法之一，它是一種優化算法，通過最小化誤差的平方來尋找數據的最佳函數匹配。利用最小二乘法可以簡便地求得未知的數據，並使得這些求得的數據與實際數據之間誤差的平方和爲最小。在機器學習中，還可以使用最小二乘法來進行曲線擬合。

上圖介紹的上海市長寧區部分房價的信息，從散點圖可以發現，房子的大小和房價彼此之間有一些依賴關係，由房子大小可以決定房子的價格，但是這種關係又是不確定的，這時候我們可以利用統計學中的迴歸模型來尋找這兩個變量之間的關係。具體步驟如下：

爲了描述簡單，本篇文章將採用一元線性模型（Y=w0+w1X ）建立迴歸模型來介紹最小二乘法。

Y i^= w 0 + w 1 X i （ 式 1 - 1 ）

其中，

Yi^ 是根據迴歸模型求得的值，則

Yi 和

Yi^ 的差就是該模型的誤差。則平方損失函數爲：

S = \sum i = 1 n (Y i - Y i^) 2 = \sum i = 1 n (Y i - w 0 - w 1 X i) 2 （ 式 1 - 2 ）

分別對w0,w1 求偏導得：

\partial S \partial w 0 = - 2 \sum i = 1 n (Y i - w 0 - w 1 X i) （ 式 1 - 3 ）

\partial S \partial w 1 = - 2 \sum i = 1 n (Y i - w 0 - w 1 X i) (- X i) （ 式 1 - 4 ）

根據我們的數學知識，函數的極值點爲偏導數爲0的點。即

\partial S \partial w 0 = 0 （ 式 1 - 5 ）

\partial S \partial w 1 = 0 （ 式 1 - 6 ）

亦即

n w 0 + \sum i = 1 n (X i) w 1 = \sum i = 1 n Y i （ 式 1 - 7 ）

\sum i = 1 n (X i) w 0 + (\sum i = 1 n x 2 i) w 1) = \sum i = 1 n (X i Y i) （ 式 1 - 8 ）

對式1-7和式1-8求解得：

w 0 = \sum n i = 1 Y i n - w 1 \sum n i = 1 X i n （ 式 1 - 9 ）

w 1 = [n \sum n i = 1 X i Y i - ( \sum n i = 1 X i \sum n i = 1 Y i ) n \sum n i = 1 X 2 i - ( \sum n i = 1 X i ) 2 （ 式 1 - 10 ）

此時,把

w0,w1 帶入式1-1，就是我們要求的迴歸模型。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.