吳恩達機器學習——第8章正則化

第8章正則化

1、目的

4、應用到邏輯迴歸

1、目的

1.1 過擬合的定義

過擬合：指的是模型對訓練集數據過度匹配，而對於新數據不能正確預測的情況。

1.2 正則化

正則化是用來解決模型過擬合問題的一種思路。

基本思路是在保留所有特徵的基礎上，減小參數的大小（參數指的是 $θ$ ）。這樣每個特徵對於預測結果的權重都會減少。

原因是過擬合是由於多項式對曲線影響過大造成的（多項式指的就是 $x^3,x^4$ 這種，通過減小 $\theta$ 就能降低這些多項式對結果的影響。

與之相對應的另一種優化思路是：把不能幫助我們正確預測結果的特徵去掉，剩下的特徵都是對預測結果起到關鍵作用的特徵。可以手工去除，也可以通過模型幫我們去除。該方式不是本文的重點。

2、原理

回憶一下線性迴歸的代價函數:
$J(θ)=\frac{1}{2m}\sum_{i=1}^m(h_θ(x^{i})-y^{i})^2$

正則化的目標是保證 $J(θ)$ 最小的情況下 $θ$ 最小，爲了使 $θ$ 變小，我們把代價函數變成如下的形式：
$J(θ)=min_θ\frac{1}{2m}\left[\sum_{i=1}^m(h_θ(x^{i})-y^{i})^2+10000θ_1^2+10000θ_2^2+10000θ_3^2+ ......\right]$
簡寫爲：
$J(θ)=min_θ\frac{1}{2m}\left[\sum_{i=1}^m(h_θ(x^{i})-y^{i})^2+\lambda\sum_{j=1}^nθ_j^2\right]$

可以看到，如果想 $J(θ)$ 最小的情況下θ最小，則 $\lambda$ 就要變大;

當 $\lambda$ 非常大的情況下，θ就只能是0了，則模型就成了一條直線了。

3、應用到線性迴歸

3.1 梯度下降

線性迴歸的梯度下降公式爲：
repeat{
$θ_0=θ_0-α\frac{1}{m}\sum_{i=1}^m(h_θ(x^{(i)})-y^{(i)})$
$θ_j=θ_j-α\frac{1}{m}\sum_{i=1}^m(h_θ(x^{(i)})-y^{(i)})*x^{(i)}_j$
}

根據第2章的介紹，特徵正則化後梯度下降的公式變成了：
repeat{
$θ_0=θ_0-α\frac{1}{m}\sum_{i=1}^m(h_θ(x^{(i)})-y^{(i)})$
$θ_j=θ_j-\left[α\frac{1}{m}\sum_{i=1}^m(h_θ(x^{(i)})-y^{(i)})*x^{(i)}_j+\frac{\lambda}{m}θ_j\right]$
}
等價於：
repeat{
$θ_0=θ_0-α\frac{1}{m}\sum_{i=1}^m(h_θ(x^{(i)})-y^{(i)})$
$θ_j=(1-\frac{\lambda}{m})θ_j-α\frac{1}{m}\sum_{i=1}^m(h_θ(x^{(i)})-y^{(i)})*x^{(i)}_j$
}

由於 $\frac{\lambda}{m}$ 是個正數，則 $1-\frac{\lambda}{m}<1$ ，所以調整後的 $θ_j$ 比之前要小。這樣就能得到比之前小的參數 $θ$ .

3.2 正規方程

正規方程的表達式爲：

$θ=(X^T*X)^{-1}*X^T*y$

正則化後變成了：

$θ=(X^T*X + \left[\begin{matrix}0&0&0&0&0\\0&1&0&0&0\\0&0&1&0&0\\0&0&0&1&0\\0&0&0&0&1\end{matrix}\right])^{-1}*X^T*y$

注意，新增的加數是一個矩陣，這個矩陣的維度與X有關聯，上述表達式只是爲了表示方便才寫成固定的矩陣；

這個矩陣與單位矩陣只差[1,1]這個座標，其它的都是一樣的。

4、應用到邏輯迴歸

應用到邏輯迴歸的方式與線性迴歸完全一致，這裏就不細說了。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

吳恩達機器學習——第8章正則化

第8章正則化

1、目的

1.1 過擬合的定義

1.2 正則化

2、原理

3、應用到線性迴歸

3.1 梯度下降

3.2 正規方程

4、應用到邏輯迴歸

一個簡單的MD5加鹽

C# 代碼學習

藍橋15屆stema編程題密碼鎖-動態規劃 C++和Python最後一道題

2021看雪SDC議題回顧 | SaTC：一種全新的物聯網設備漏洞自動化挖掘方法

Kafka存儲機制

aws語音呼叫調用，告警電話

【轉】[C#] WebAPI 防止併發調用二（冥等性）

C#/.NET/.NET Core優秀項目和框架2024年4月簡報

HTTP URL 詳解

得物 ZooKeeper SLA 也可以 99.99%

mac使用技巧總結

吳恩達機器學習——第3章線性代數回顧

吳恩達機器學習——第13章 SVM支持向量機

吳恩達機器學習——第15章降維

吳恩達機器學習——第2、5章線性迴歸

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

吳恩達機器學習——第8章 正則化

第8章 正則化

1、目的

1.1 過擬合的定義

1.2 正則化

2、原理

3、應用到線性迴歸

3.1 梯度下降

3.2 正規方程

4、應用到邏輯迴歸

吳恩達機器學習——第8章正則化

第8章正則化