動手訓練模型系列:過擬合與訓練集規模

本模型實現對512*512圖像的像素二分類問題;紅色或藍色的樣本點(每個樣本包含座標(x,y)值)坐落在對應顏色的區域內則樣本正確分類,反之分類錯誤;

loss值採用Cross_entropy計算,表徵訓練/測試樣本與實際訓練/測試分類結果的總誤差。

操作介紹:

在"訓練集與測試集數量比"橫軸上選擇不同的按鈕(1:9,1:1,9:1),點擊"模型訓練"按鈕

模型結構:

ANN人工神經網絡, 兩層全連接層FC Layer隱含層

(點擊圖片 進入動手訓練模型小程序)

模型訓練小結:

過擬合(Overfit)是AI模型訓練中一個常見且重要的問題,具體表現爲:一個針對訓練集樣本表現良好的模型,針對測試集表現出泛化性不足,無法正確完成模型任務.造成過擬合的原因主要是訓練集樣本相對於測試集樣本的規模過少或特徵分佈差異過大.下面實驗,我們將手動選擇三個不同的數據集,完成不同模型訓練並觀察過擬合現象的出現。 當訓練集相對於測試集過小或特徵差異過大時,容易出現過擬合現象。

模型參數備註:

激活函數Activation: Sigmoid 正則化策略Regularization:None 學習率Learning rate: 0.1 Batch Size:1 Epoch迭代次數:1000

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章