0. 版權聲明

1. 評估學習算法

一般按照 7:3 的比例將樣本劃分爲訓練集、測試集；
- 若需要交叉驗證集，則按 6:2:2 的比例將樣本劃分爲訓練集、交叉驗證集（cross validation set）、測試集；
- 按比例劃分時，應隨機抽取，確保訓練集、測試集中的數據均服從某種分佈規律；
測試誤差舉例：在線性迴歸中應用平方誤差時， $J_{test}(\theta)=\frac{1}{2m_{test}}\sum_{i=1}^{m_{test}}(h_{\theta}(x_{test}^{(i)})-y_{test}^{(i)})^{2}$ ；
0/1 錯分類率（誤分類率）：
- $err(h_{\Theta}(x),y)=\begin{cases}1 & h_{\Theta} \geq 0.5,y=0; h_{\Theta} < 0.5,y=1; \\0 & otherwise\end{cases}$ ；
- Test Error = $\frac{1}{m_{test}}\sum_{i=1}^{m_{test}}err(h_{\Theta}(x_{test}^{(i)}),y_{test}^{(i)})$ ；
- 0/1 錯分類率（誤分類率） = $\frac{被錯誤分類的測試樣本數}{測試樣本總數}$ ；
評價假設函數的步驟：
- 從訓練集中學得 $\Theta$ ；
- 將求得的參數值應用於測試集中，計算測試誤差 $J_{test}(\Theta)$ ；

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.