機器學習(周志華):版本空間的理解和求法(詳細版)

針對西瓜分類分題進行講解

屬性: 3個屬性

色澤:(青綠,烏黑,淺白)

根蒂:(蜷縮,硬挺,稍蜷)

敲聲:(濁響,清脆,沉悶)

假設空間: 屬性所有可能取值組成的可能的樣本

假設空間的個數:4 * 4 * 4+1 = 49個,

求法:這三個值組成一個向量,這個向量的每個屬性的可能

取值的集合就是假設空間。每個屬性可以取通配符 *,爲都符合

的意思,上面的+1是存在 Ø的情況

1 色澤=*,根蒂=*,敲聲=*

2 色澤=青綠,根蒂=*,敲聲=*

3 色澤=烏黑,根蒂=*,敲聲=*

4 色澤=*,根蒂=蜷縮,敲聲=*

5 色澤=*,根蒂=硬挺,敲聲=*

6 色澤=*,根蒂=稍蜷,敲聲=*

7 色澤=*,根蒂=*,敲聲=濁響

8 色澤=*,根蒂=*,敲聲=清脆

9 色澤=*,根蒂=*,敲聲=沉悶

10 色澤=青綠,根蒂=蜷縮,敲聲=*

11 色澤=青綠,根蒂=硬挺,敲聲=*

12 色澤=青綠,根蒂=稍蜷,敲聲=*

13 色澤=烏黑,根蒂=蜷縮,敲聲=*

14 色澤=烏黑,根蒂=硬挺,敲聲=*

15 色澤=烏黑,根蒂=稍蜷,敲聲=*

16 色澤=青綠,根蒂=*,敲聲=濁響

17 色澤=青綠,根蒂=*,敲聲=清脆

18 色澤=青綠,根蒂=*,敲聲=沉悶

19 色澤=烏黑,根蒂=*,敲聲=濁響

20 色澤=烏黑,根蒂=*,敲聲=清脆

21 色澤=烏黑,根蒂=*,敲聲=沉悶

22 色澤=*,根蒂=蜷縮,敲聲=濁響

23 色澤=*,根蒂=蜷縮,敲聲=清脆

24 色澤=*,根蒂=蜷縮,敲聲=沉悶

25 色澤=*,根蒂=硬挺,敲聲=濁響

26 色澤=*,根蒂=硬挺,敲聲=清脆

27 色澤=*,根蒂=硬挺,敲聲=沉悶

28 色澤=*,根蒂=稍蜷,敲聲=濁響

29 色澤=*,根蒂=稍蜷,敲聲=清脆

30 色澤=*,根蒂=稍蜷,敲聲=沉悶

31 色澤=青綠,根蒂=蜷縮,敲聲=濁響

32 色澤=青綠,根蒂=蜷縮,敲聲=清脆

33 色澤=青綠,根蒂=蜷縮,敲聲=沉悶

34 色澤=青綠,根蒂=硬挺,敲聲=濁響

35 色澤=青綠,根蒂=硬挺,敲聲=清脆

36 色澤=青綠,根蒂=硬挺,敲聲=沉悶

37 色澤=青綠,根蒂=稍蜷,敲聲=濁響

38 色澤=青綠,根蒂=稍蜷,敲聲=清脆

39 色澤=青綠,根蒂=稍蜷,敲聲=沉悶

40 色澤=烏黑,根蒂=蜷縮,敲聲=濁響

41 色澤=烏黑,根蒂=蜷縮,敲聲=清脆

42 色澤=烏黑,根蒂=蜷縮,敲聲=沉悶

43 色澤=烏黑,根蒂=硬挺,敲聲=濁響

44 色澤=烏黑,根蒂=硬挺,敲聲=清脆

45 色澤=烏黑,根蒂=硬挺,敲聲=沉悶

46 色澤=烏黑,根蒂=稍蜷,敲聲=濁響

47 色澤=烏黑,根蒂=稍蜷,敲聲=清脆

48 色澤=烏黑,根蒂=稍蜷,敲聲=沉悶

49 Ø

訓練集: 人爲給定的訓練數據

注:不同的訓練集合會求出不同的版本空間

在這裏插入圖片描述
求版本空間:

對應着給出的已知數據集,將與正樣本不一致的、與負樣本一致的假設刪除。

更據訓練集依次刪除假設空間裏的數據樣本:

(1,(色澤=青綠、根蒂=蜷縮、敲聲=濁響),好瓜)

可以刪除假設空間中的3、5、6、8、9、11-15、17-21、23-30、32-49

(2,(色澤=烏黑、根蒂=蜷縮、敲聲=濁響),好瓜)

可以刪除剩餘假設空間中的2、10、16、31

(3,(色澤=青綠、根蒂=硬挺、敲聲=清脆),壞瓜)

可以刪除剩餘假設空間中的1

(4,(色澤=烏黑、根蒂=稍蜷、敲聲=沉悶),壞瓜)

剩餘假設空間中無可刪除的假設

學習過後剩餘的假設爲:

4 色澤=*,根蒂=蜷縮,敲聲=*

7 色澤=*,根蒂=*,敲聲=濁響

22 色澤=*,根蒂=蜷縮,敲聲=濁響

這三個就是這個訓練集下的版本空間

總結:

1、寫出假設空間:先列出所有可能的樣本點(即特徵向量)

(即每個屬性都取到所有的屬性值)

2、對應着給出的已知數據集,將與正樣本不一致的、與負樣本

一致的假設刪除。

聽說點贊關注的人都很好看!!!

歡迎點贊關注,後續會有更多機器學習文章發佈,我們一起來學機器學習

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章