《機器學習》第二章學習總結

這裏寫圖片描述
1.評估方法
留出法分層採樣,全部樣本的x%用來作爲訓練樣本,1-x%用來作爲測試樣本

交叉驗證K折交叉驗證,樣本分成k份,每次按順序取k-1份訓練樣本,生另一分作爲測試樣本。

自助法隨機取樣,每次隨機挑出樣品一個放入樣品級,重複m次,得到訓練集合 ,剩下沒有被抽中的樣品作爲測試。

2.性能度量
A.

錯誤率 精度
x/m 1-x/m

x :預測錯誤的樣本數量
m:樣本的全部數量

B.
查準率和查全率

真實 預測的正例 預測的反例
正例 TP(真正例) FN(假反例子)
反例 FP(假正例) TN(真反例)

P(查準率) = TP / (TP+FP)
R(查全率) = TP/(TP+FN)

C.
ROC 和AUC
ROC :以FPRTPR 爲x,和y軸繪製的曲線,下方的面積是AUC。
FPR:FP/(TN+FP)
TPR:TP/(TP+FN)
繪製ROC:這裏寫鏈接內容

D.
敏感代價錯誤率
P = (F(cost01) +F(cost10))/m

F(cost01):把0認成1的樣品代價總和
F(cost10):把1認成0的樣品代價總和

3.偏差,泛化誤差和方差

發佈了35 篇原創文章 · 獲贊 14 · 訪問量 2萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章