【ML2】機器學習之線性迴歸

原創

天下我心

2020-06-11 14:26

【知識儲備】

線性迴歸：

1：函數模型（Model）：

假設有訓練數據

那麼爲了方便我們寫成矩陣的形式

2：損失函數（cost）：

現在我們需要根據給定的X求解W的值，這裏採用最小二乘法。

最小二乘法：如果有很多的給定點，這時候我們需要找出一條線去擬合它，那麼先假設這個線的方程，然後把數據點代入假設的方程得到觀測值，求使得實際值與觀測值相減的平方和最小的參數。對變量求偏導聯立便可求。

因此損失代價函數爲：

3：算法（algorithm）：

現在我們的目的就是求解出一個使得代價函數最小的W：

a.矩陣滿秩可求解時（求導等於0）：

b.矩陣不滿秩時（梯度下降）：

梯度下降算法是一種求局部最優解的方法，對於F(x)，在a點的梯度是F(x)增長最快的方向，那麼它的相反方向則是該點下降最快的方向（原理：將函數比作一座山，我們站在某個山坡上，往四周看，從哪個方向向下走一小步，能夠下降的最快）

注意：當變量之間大小相差很大時，應該先將他們做處理，使得他們的值在同一個範圍，這樣比較準確。

1）首先對θ賦值，這個值可以是隨機的，也可以讓θ是一個全零的向量。

2）改變θ的值，使得J(θ)按梯度下降的方向進行減少。

描述一下梯度減少的過程，對於我們的函數J(θ)求偏導J：

Repeat until convergence：{

下面是更新的過程，也就是θi會向着梯度最小的方向進行減少。θi表示更新之前的值，-後面的部分表示按梯度方向減少的量，α表示步長，也就是每次按照梯度減少的方向變化多少。

}

假設有數據集D時：

對損失函數求偏導如下：

使用矩陣表示（方便計算）

從概率層面解釋-迴歸模型的目標函數：

基本上每個模型都會有一個對應的目標函數，可以通過不同的最優化求解方法（梯度下降，牛頓法等等）對這些對應的目標函數進行求解。【線性迴歸模型，我們知道實際上是通過多個自變量對自變量進行曲線擬合】。我們希望找到一條可以較好擬合的曲線，那我們如何判斷一條曲線的擬合程度的好壞。上面講到，我們採用的是最小二乘法（預測值和真實值得誤差的平方和），那爲什麼要用這個作爲目標函數呢？可以從中心極限定理、高斯分佈來分析：

1.中心極限定理：設有n個隨機變量，X1,X2,X3,Xn,他們之間相互獨立，並且有相同的數學期望和均值。E(X)=u;D(x)=δ2.令Yn爲這n個隨機變量之和。