假設空間 版本空間&查全率 查準率

一、假設空間 版本空間

根據P4表1.1和P5圖1.1得,

       假設空間爲:     

1 色澤=*,     根蒂=*,    敲聲=*
2 色澤=青綠, 根蒂=*,    敲聲=*
3 色澤=烏黑, 根蒂=*,    敲聲=*
4 色澤=*,     根蒂=蜷縮,敲聲=*
5 色澤=*,     根蒂=硬挺,敲聲=*
6 色澤=*,     根蒂=稍蜷,敲聲=*
7 色澤=*,     根蒂=*,    敲聲=濁響
8 色澤=*,     根蒂=*,    敲聲=清脆
9 色澤=*,     根蒂=*,    敲聲=沉悶
10 色澤=青綠,根蒂=蜷縮,敲聲=*
11 色澤=青綠,根蒂=硬挺,敲聲=*
12 色澤=青綠,根蒂=稍蜷,敲聲=*
13 色澤=烏黑,根蒂=蜷縮,敲聲=*
14 色澤=烏黑,根蒂=硬挺,敲聲=*
15 色澤=烏黑,根蒂=稍蜷,敲聲=*
16 色澤=青綠,根蒂=*,    敲聲=濁響
17 色澤=青綠,根蒂=*,    敲聲=清脆
18 色澤=青綠,根蒂=*,    敲聲=沉悶
19 色澤=烏黑,根蒂=*,    敲聲=濁響
20 色澤=烏黑,根蒂=*,    敲聲=清脆
21 色澤=烏黑,根蒂=*,    敲聲=沉悶
22 色澤=*,    根蒂=蜷縮,敲聲=濁響
23 色澤=*,    根蒂=蜷縮,敲聲=清脆
24 色澤=*,    根蒂=蜷縮,敲聲=沉悶
25 色澤=*,    根蒂=硬挺,敲聲=濁響
26 色澤=*,    根蒂=硬挺,敲聲=清脆
27 色澤=*,    根蒂=硬挺,敲聲=沉悶
28 色澤=*,    根蒂=稍蜷,敲聲=濁響
29 色澤=*,    根蒂=稍蜷,敲聲=清脆
30 色澤=*,    根蒂=稍蜷,敲聲=沉悶
31 色澤=青綠,根蒂=蜷縮,敲聲=濁響
32 色澤=青綠,根蒂=蜷縮,敲聲=清脆
33 色澤=青綠,根蒂=蜷縮,敲聲=沉悶
34 色澤=青綠,根蒂=硬挺,敲聲=濁響
35 色澤=青綠,根蒂=硬挺,敲聲=清脆
36 色澤=青綠,根蒂=硬挺,敲聲=沉悶
37 色澤=青綠,根蒂=稍蜷,敲聲=濁響
38 色澤=青綠,根蒂=稍蜷,敲聲=清脆
39 色澤=青綠,根蒂=稍蜷,敲聲=沉悶
40 色澤=烏黑,根蒂=蜷縮,敲聲=濁響
41 色澤=烏黑,根蒂=蜷縮,敲聲=清脆
42 色澤=烏黑,根蒂=蜷縮,敲聲=沉悶
43 色澤=烏黑,根蒂=硬挺,敲聲=濁響
44 色澤=烏黑,根蒂=硬挺,敲聲=清脆
45 色澤=烏黑,根蒂=硬挺,敲聲=沉悶
46 色澤=烏黑,根蒂=稍蜷,敲聲=濁響
47 色澤=烏黑,根蒂=稍蜷,敲聲=清脆
48 色澤=烏黑,根蒂=稍蜷,敲聲=沉悶
49 Ø

圖1.1下面的那段話描述了學習的過程:搜索過程中可以不斷刪除與正例(好瓜)不一致的假設、和(或)與反例(壞瓜)一致的假設。最終將會獲得與訓練集一致(即對所有訓練樣本能夠進行正確判斷)的假設,這就是我們學得的結果。

按照上述過程進行學習:
(1)(色澤=青綠、根蒂=蜷縮、敲聲=濁響),好瓜         【此處保留非*號內容與(1)對應位置取值相同的假設】
保留1、2、4、7、10、16、22、31
(2)(色澤=烏黑、根蒂=蜷縮、敲聲=濁響),好瓜
保留1、4、7、22
(3)(色澤=青綠、根蒂=硬挺、敲聲=清脆),壞瓜
刪除1
(4)(色澤=烏黑、根蒂=稍蜷、敲聲=沉悶),壞瓜
剩餘假設空間中無可刪除的假設

學習過後剩餘的假設爲
4 色澤=*,根蒂=蜷縮,敲聲=*
7 色澤=*,根蒂=*,敲聲=濁響
22 色澤=*,根蒂=蜷縮,敲聲=濁響

這就是最後的“假設集合”,也就是“版本空間”。

二、查全率 查準率
Machine learning 中查準率(Precision)、查全率(recall)和Accuracy。 
表示分類正確: 
True Positive:本來是正樣例,分類成正樣例。 

True Negative:本來是負樣例,分類成負樣例。

(據個人的理解,TP和TN的損失爲0,一般它們的數量不變) 

表示分類錯誤: 
False Positive :本來是負樣例,分類成正樣例,通常叫誤報。 

False Negative:本來是正樣例,分類成負樣例,通常叫漏報。


P=TP/(TP+FP)

R=TP/(TP+FN)


從實際意義來講,

P可以看出是否有被誤報的情況,。

R可以看出是否有被漏報的情況。




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章