pre
爲了便於理解使用只含有一個特徵的線性迴歸進行陳述:
假設函數:
hθ(x(i))=θ1x(i)+θ0
使用MSE損失函數
J(θ0,θ1)=2m1∑i=1m(hθ(x(i))−y(i))2
使用MSE + L2 正則化
J(θ0,θ1)=2m1∑i=1m(hθ(x(i))−y(i))2+2m1∣∣θ1∣∣2
批梯度下降
公式
代碼demo
隨機梯度下降
公式
代碼demo
小批量梯度下降
公式
代碼demo
參考文獻
REF1
REF2
REF3
REF4
其中REF3在BGD上的公式有誤,參考REF1