假设空间 版本空间&查全率 查准率

一、假设空间 版本空间

根据P4表1.1和P5图1.1得,

       假设空间为:     

1 色泽=*,     根蒂=*,    敲声=*
2 色泽=青绿, 根蒂=*,    敲声=*
3 色泽=乌黑, 根蒂=*,    敲声=*
4 色泽=*,     根蒂=蜷缩,敲声=*
5 色泽=*,     根蒂=硬挺,敲声=*
6 色泽=*,     根蒂=稍蜷,敲声=*
7 色泽=*,     根蒂=*,    敲声=浊响
8 色泽=*,     根蒂=*,    敲声=清脆
9 色泽=*,     根蒂=*,    敲声=沉闷
10 色泽=青绿,根蒂=蜷缩,敲声=*
11 色泽=青绿,根蒂=硬挺,敲声=*
12 色泽=青绿,根蒂=稍蜷,敲声=*
13 色泽=乌黑,根蒂=蜷缩,敲声=*
14 色泽=乌黑,根蒂=硬挺,敲声=*
15 色泽=乌黑,根蒂=稍蜷,敲声=*
16 色泽=青绿,根蒂=*,    敲声=浊响
17 色泽=青绿,根蒂=*,    敲声=清脆
18 色泽=青绿,根蒂=*,    敲声=沉闷
19 色泽=乌黑,根蒂=*,    敲声=浊响
20 色泽=乌黑,根蒂=*,    敲声=清脆
21 色泽=乌黑,根蒂=*,    敲声=沉闷
22 色泽=*,    根蒂=蜷缩,敲声=浊响
23 色泽=*,    根蒂=蜷缩,敲声=清脆
24 色泽=*,    根蒂=蜷缩,敲声=沉闷
25 色泽=*,    根蒂=硬挺,敲声=浊响
26 色泽=*,    根蒂=硬挺,敲声=清脆
27 色泽=*,    根蒂=硬挺,敲声=沉闷
28 色泽=*,    根蒂=稍蜷,敲声=浊响
29 色泽=*,    根蒂=稍蜷,敲声=清脆
30 色泽=*,    根蒂=稍蜷,敲声=沉闷
31 色泽=青绿,根蒂=蜷缩,敲声=浊响
32 色泽=青绿,根蒂=蜷缩,敲声=清脆
33 色泽=青绿,根蒂=蜷缩,敲声=沉闷
34 色泽=青绿,根蒂=硬挺,敲声=浊响
35 色泽=青绿,根蒂=硬挺,敲声=清脆
36 色泽=青绿,根蒂=硬挺,敲声=沉闷
37 色泽=青绿,根蒂=稍蜷,敲声=浊响
38 色泽=青绿,根蒂=稍蜷,敲声=清脆
39 色泽=青绿,根蒂=稍蜷,敲声=沉闷
40 色泽=乌黑,根蒂=蜷缩,敲声=浊响
41 色泽=乌黑,根蒂=蜷缩,敲声=清脆
42 色泽=乌黑,根蒂=蜷缩,敲声=沉闷
43 色泽=乌黑,根蒂=硬挺,敲声=浊响
44 色泽=乌黑,根蒂=硬挺,敲声=清脆
45 色泽=乌黑,根蒂=硬挺,敲声=沉闷
46 色泽=乌黑,根蒂=稍蜷,敲声=浊响
47 色泽=乌黑,根蒂=稍蜷,敲声=清脆
48 色泽=乌黑,根蒂=稍蜷,敲声=沉闷
49 Ø

图1.1下面的那段话描述了学习的过程:搜索过程中可以不断删除与正例(好瓜)不一致的假设、和(或)与反例(坏瓜)一致的假设。最终将会获得与训练集一致(即对所有训练样本能够进行正确判断)的假设,这就是我们学得的结果。

按照上述过程进行学习:
(1)(色泽=青绿、根蒂=蜷缩、敲声=浊响),好瓜         【此处保留非*号内容与(1)对应位置取值相同的假设】
保留1、2、4、7、10、16、22、31
(2)(色泽=乌黑、根蒂=蜷缩、敲声=浊响),好瓜
保留1、4、7、22
(3)(色泽=青绿、根蒂=硬挺、敲声=清脆),坏瓜
删除1
(4)(色泽=乌黑、根蒂=稍蜷、敲声=沉闷),坏瓜
剩余假设空间中无可删除的假设

学习过后剩余的假设为
4 色泽=*,根蒂=蜷缩,敲声=*
7 色泽=*,根蒂=*,敲声=浊响
22 色泽=*,根蒂=蜷缩,敲声=浊响

这就是最后的“假设集合”,也就是“版本空间”。

二、查全率 查准率
Machine learning 中查准率(Precision)、查全率(recall)和Accuracy。 
表示分类正确: 
True Positive:本来是正样例,分类成正样例。 

True Negative:本来是负样例,分类成负样例。

(据个人的理解,TP和TN的损失为0,一般它们的数量不变) 

表示分类错误: 
False Positive :本来是负样例,分类成正样例,通常叫误报。 

False Negative:本来是正样例,分类成负样例,通常叫漏报。


P=TP/(TP+FP)

R=TP/(TP+FN)


从实际意义来讲,

P可以看出是否有被误报的情况,。

R可以看出是否有被漏报的情况。




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章