如何解決過擬合、欠擬合【學習總結】

原創

2020-03-17 18:50

一、過擬合(Overfitting)

If you can fit the training data,but largeerror on testing data,then you probably have large variance.
過擬合是指模型在訓練集上的表現很好，但在測試集和新數據上的表現很差。

Small Bias; Large Variance；Complex Model.

（1）More Data: 使用更多的訓練數據是解決過擬合問題最有效的手段，因爲更多的樣本能夠讓模型學習到更多有效的特徵，減少噪聲的影響。

（2）Regularizationg: 給模型參數添加一定的正則約束。

（3）降低模型複雜度: 適當降低模型複雜度可以避免模型擬合過多的採樣噪聲。

（4）使用集成學習方法: 把多個模型集成在一起，降低單一模型的過擬合風險，如Bagging。

If your model cannot even fit the training examples,then you have large bias.
欠擬合是指訓練的模型不能很好地擬合數據關係。

Large Bias; Small Variance; Simple Model.

（1） Redesign Model: 重新設計模型，增加模型的複雜度。簡單模型的學習能力較差，增加模型複雜度可以使模型有更強的擬合能力。
例如，在線性模型中添加高次項，在神經網絡模型中增加網絡層數或神經元個數等。

（2）Add more features as input: 當特徵不足或現有特徵與樣本標籤的相關性不強時，模型容易出現欠擬合。

參考文獻：學習總結參考李老師公開課。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.