0. 版權聲明
- machine learning 系列筆記來源於Andrew Ng 教授在 Coursera 網站上所授課程《machine learning》1;
- 該系列筆記不以盈利爲目的,僅用於個人學習、課後複習及交流討論;
- 如有侵權,請與本人聯繫([email protected]),經覈實後即刻刪除;
- 轉載請註明出處;
1. 評估學習算法
1.1 評估假設函數
- 一般按照 7:3 的比例將樣本劃分爲訓練集、測試集;
- 若需要交叉驗證集,則按 6:2:2 的比例將樣本劃分爲訓練集、交叉驗證集(cross validation set)、測試集;
- 按比例劃分時,應隨機抽取,確保訓練集、測試集中的數據均服從某種分佈規律;
- 測試誤差舉例:在線性迴歸中應用平方誤差時,;
- 0/1 錯分類率(誤分類率):
- ;
- Test Error = ;
- 0/1 錯分類率(誤分類率) = ;
- 評價假設函數的步驟:
- 從訓練集中學得 ;
- 將求得的參數值應用於測試集中,計算測試誤差 ;