文章目錄
機器學習內在劃分邏輯
Scenario 訓練場景 由拿到的數據決定
task 任務類型 由想得到的輸出決定
method 所選擇的function set
只是specialize了Classifacaiton 的具體分類,但是每個senerio 都包含這些task, 每個task 都包含這些method。
誤差來源
模型誤差=bias(訓練集上誤差)+varience(測試集上誤差)
訓練的目的:
1.training set 上誤差小,即bias小
2.traning set 誤差 接近 test set 誤差,即varience 小
模型越複雜,擬合的越好,也就是bias越小,但是受訓練集數據個別點的影響就大,也就是預測出來的點較爲離散,varience越大。
模型越簡單,受個別訓練數據的影響就越小,就是說模型穩定性較強,varience越小,但是一開始對訓練數據的擬合就不好了。