原文鏈接
我的個人博客
在機器學習和模式識別等領域中,一般需要將樣本分成獨立的三部分訓練集(train set),驗證集(validation set ) 和測試集(test set)。
區別
訓練集(Training set)模型擬合的數據樣本,用來估計模型,
驗證集(Cross Validation set) 用來確定網絡結構或者控制模型複雜程度的參數
測試集(Test set),用來檢驗最終選擇最優的模型的性能如何
在CSDN博主「Kieven2oo8這裏看到了一個很好的比喻
- 訓練集-----------學生的課本;學生 根據課本里的內容來掌握知識。
- 驗證集------------作業,通過作業可以知道 不同學生學習情況、進步的速度快慢。
- 測試集-----------考試,考的題是平常都沒有見過,考察學生舉一反三的能力。