機器學習的偏差(bias)和方差(variance)問題

原創

2018-09-09 21:24

減少偏差

偏差過大又稱欠擬合（underfitting），原因通常是：

解決的辦法自然是：

解決偏差問題是最基本的要求，是最低標準，模型直到可以擬合數據爲止纔算合格。

方差過大又稱過擬合（overfitting），原因通常是：

通常繪製學習曲線有助於判斷當前的問題究竟是偏差問題還是方差問題。學習曲線是指將訓練誤差和交叉驗證誤差作爲y軸，訓練輪數作爲x軸，繪製曲線。
你會發現如果偏差很大，訓練輪數達到一定次數後再怎麼訓練，訓練誤差依然會保持相對較高的值。

當訓練誤差（training error）很大時，毫無疑問有偏差問題。
當訓練誤差和交叉驗證集的誤差都很大時，先解決偏差問題。
當訓練誤差很小，而交叉驗證集的誤差很大時，就很可能是方差問題。
爲了讓兩者都儘量小，通常有一箇中間點，可以權衡二者，達到最優的結果。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.