最小二乘法
最小二乘法,又稱最小平方法,是機器學習中基礎的算法之一,它是一種優化算法,通過最小化誤差的平方來尋找數據的最佳函數匹配。利用最小二乘法可以簡便地求得未知的數據,並使得這些求得的數據與實際數據之間誤差的平方和爲最小。在機器學習中,還可以使用最小二乘法來進行曲線擬合。
上圖介紹的上海市長寧區部分房價的信息,從散點圖可以發現,房子的大小和房價彼此之間有一些依賴關係,由房子大小可以決定房子的價格,但是這種關係又是不確定的,這時候我們可以利用統計學中的迴歸模型來尋找這兩個變量之間的關係。具體步驟如下:
- 畫散點圖,直觀判斷;
- 用近似模型來描述它們的關係,如一元線性模型;
- 建立迴歸模型;
- 對模型進行參數估計,最小二乘法是這些參數估計的一種常用的方法,這也是本篇博文講述的重點;
- 討論模型的效果;
爲了描述簡單,本篇文章將採用一元線性模型(
其中,
分別對
根據我們的數學知識,函數的極值點爲偏導數爲0的點。即
亦即
對式1-7和式1-8求解得:
此時,把