原创 過擬合解決方案之正則化

1.過擬合問題 對於過擬合問題,通常原因是模型選擇太過複雜,也有可能是訓練數據太少。對於模型太複雜的情況,我們一般有如下考慮:一是通過分析刪除部分特徵(比如重複多餘的特徵或者對輸出值貢獻不太大的特徵),但是這樣有可能會損失一部分信息。所以,

原创 機器學習之欠擬合和過擬合(一)

1.欠擬合(underfitting)與過擬合(overfitting) 在機器學習中,我們的主要思想是通過對數據集的學習來生成我們的假設模型。在對數據集進行擬合的過程中,我們可能會遇到欠擬合和過擬合的問題。以身高預測的例子爲例,這裏給出7