欠擬合和過擬合的一般解決方法

原創

2019-10-25 17:21

欠擬合和過擬合的一般解決方法

解決過擬合(高方差)的方法

欠擬合與過擬合

欠擬合是指模型在訓練集、驗證集和測試集上均表現不佳的情況；
過擬合是指模型在訓練集上表現很好，到了驗證和測試階段就大不如意了，即模型的泛化能力很差。

欠擬合和過擬合一直是機器學習訓練中的難題，在進行模型訓練的時候往往要對這二者進行權衡，使得模型不僅在訓練集上表現良好，在驗證集以及測試集上也要有出色的預測能力。下面對解決欠擬合和過擬合的一般方法作一總結，說明大致的處理方向，具體應用還得結合實際的任務、數據和算法模型等。

解決欠擬合(高偏差)的方法

1.模型複雜化

對同一個算法複雜化。例如迴歸模型添加更多的高次項，增加決策樹的深度，增加神經網絡的隱藏層數和隱藏單元數等
棄用原來的算法，使用一個更加複雜的算法或模型。例如用神經網絡來替代線性迴歸，用隨機森林來代替決策樹等

2.增加更多的特徵，使輸入數據具有更強的表達能力

特徵挖掘十分重要，尤其是具有強表達能力的特徵，往往可以抵過大量的弱表達能力的特徵
特徵的數量往往並非重點，質量纔是，總之強特最重要
能否挖掘出強特，還在於對數據本身以及具體應用場景的深刻理解，往往依賴於經驗

3.調整參數和超參數

超參數包括：
- 神經網絡中：學習率、學習衰減率、隱藏層數、隱藏層的單元數、Adam優化算法中的β1和β2參數、batch_size數值等
- 其他算法中：隨機森林的樹數量，k-means中的cluster數，正則化參數λ等

4.增加訓練數據往往沒有用

欠擬合本來就是模型的學習能力不足，增加再多的數據給它訓練它也沒能力學習好

5.降低正則化約束

正則化約束是爲了防止模型過擬合，如果模型壓根不存在過擬合而是欠擬合了，那麼就考慮是否降低正則化參數λ或者直接去除正則化項

解決過擬合(高方差)的方法

1.增加訓練數據數

發生過擬合最常見的現象就是數據量太少而模型太複雜
過擬合是由於模型學習到了數據的一些噪聲特徵導致，增加訓練數據的量能夠減少噪聲的影響，讓模型更多地學習數據的一般特徵
增加數據量有時可能不是那麼容易，需要花費一定的時間和精力去搜集處理數據
利用現有數據進行擴充或許也是一個好辦法。例如在圖像識別中，如果沒有足夠的圖片訓練，可以把已有的圖片進行旋轉，拉伸，鏡像，對稱等，這樣就可以把數據量擴大好幾倍而不需要額外補充數據
注意保證訓練數據的分佈和測試數據的分佈要保持一致，二者要是分佈完全不同，那模型預測真可謂是對牛彈琴了

2.使用正則化約束

在代價函數後面添加正則化項，可以避免訓練出來的參數過大從而使模型過擬合。使用正則化緩解過擬合的手段廣泛應用，不論是在線性迴歸還是在神經網絡的梯度下降計算過程中，都應用到了正則化的方法。常用的正則化有l1正則和l2正則，具體使用哪個視具體情況而定，一般l2正則應用比較多

3.減少特徵數

欠擬合需要增加特徵數，那麼過擬合自然就要減少特徵數。去除那些非共性特徵，可以提高模型的泛化能力

4.調整參數和超參數

不論什麼情況，調參是必須的

5.降低模型的複雜度

欠擬合要增加模型的複雜度，那麼過擬合正好反過來

6.使用Dropout

這一方法只適用於神經網絡中，即按一定的比例去除隱藏層的神經單元，使神經網絡的結構簡單化

7.提前結束訓練

即early
stopping，在模型迭代訓練時候記錄訓練精度(或損失)和驗證精度(或損失)，倘若模型訓練的效果不再提高，比如訓練誤差一直在降低但是驗證誤差卻不再降低甚至上升，這時候便可以結束模型訓練了

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

欠擬合和過擬合的一般解決方法

欠擬合和過擬合的一般解決方法

欠擬合與過擬合

解決欠擬合(高偏差)的方法

1.模型複雜化

2.增加更多的特徵，使輸入數據具有更強的表達能力

3.調整參數和超參數

4.增加訓練數據往往沒有用

5.降低正則化約束

解決過擬合(高方差)的方法

1.增加訓練數據數

2.使用正則化約束

3.減少特徵數

4.調整參數和超參數

5.降低模型的複雜度

6.使用Dropout

7.提前結束訓練

記一次 .NET某工業設計軟件崩潰分析

創建 Vue3 項目

TS + Webpack 整合 Jest

分享5款.NET開源免費的Redis客戶端組件庫

安卓手機如何登錄抖音境外版

golang開發 gorilla websocket的使用

面試官：如果不允許線程池丟棄任務，應該選擇哪個拒絕策略？

嵌入式汽車電子學習路線

Mac卸載 Node npm，升級 Node

uni.showModel內容換行

【賽碼】（基本算法-難度2）下樓我最快【Python】

數據庫面試題（基本概念、索引、事務）

【字節跳動】（測試工程師-面試）求階乘的累加和【Python】

【360】（數據分析師）表面積【Python】

【賽碼】（基本算法-難度2）迴文串【Python】

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結