機器學習————樸素貝葉斯

樸素貝葉斯

獨立事件

在這裏插入圖片描述
我們現在用p1(x,y)表示數據點(x,y)屬於類別1(圓)的概率,用p2(x,y)表示數據點(x,y)屬於類別2(三角)的概率
那麼對於一個新的數據點(x,y) 我們可以用下面的規則來判斷它的類型
如果p1(x,y) > p2(x,y),那麼類別爲1
如果p2(x,y) > p1(x,y),那麼類別爲2

獨立事件:

在一次實驗中,一個事件的發生不會影響到另一個事件發生的概率

P(AB) = P(A)P(B)

在這裏插入圖片描述
求打噴嚏的建築工人感冒的概率
A : 感冒
B :打噴嚏 x 建築工人

P(感冒|打噴嚏X建築工人)
=P(打噴嚏x建築工人|感冒)xP(感冒)/P(打噴嚏X建築工人)
=P(打噴嚏|感冒) x P(建築工人|感冒) x P(感冒) / P(打噴嚏) x P(建築工人)
= 0.66 x 0.33 x 0.5 / 0.5 x0.33
=0.66

  • 使用貝葉斯對在線社區留言本進行分類:

爲了不影響社區的發展,我們要屏蔽侮辱性言論。
所以要構建一個快速的過濾器,如果某條留言使用了負面或者侮辱性的語言,
那麼就將該留言標識爲內容不當

A: 侮辱性言論的概率
B: 我說這句話的概率 = 我說的這句話中的文字出現的概率

思想:
說白了,套一下公式,就是
P(侮辱性言論的概率|我說的這句話中的文字出現的概率)
= P(我說的這句話中的文字出現的概率|當言論是侮辱性的時候)*P(侮辱性言論的概率)
/P(我說的這句話中的文字出現的概率)

A1 :‘My’ 在留言中出現的概率 A2: ‘Dog’在留言中出現的概率 A3: ‘take’在留言中不出現的概率….
B : 留言是非侮辱性的概率

P(留言是非侮辱性的概率| ‘My’ 在留言中出現的概率(時候) X ‘Dog’在留言中出現的概率… )
=P(‘My’ 在留言中出現的概率 X ‘Dog’在留言中出現的概率… |留言是非侮辱性的概率)
xP(留言是非侮辱性的概率)/P(‘My’ 在留言中出現的概率(時候) X ‘Dog’在留言中出現的概率…)
=P(‘My’ 在留言中出現的概率|留言是非侮辱性的概率) x P (‘Dog’ 在留言中出現的概率|留言是非侮辱性的概率) x…x P(留言是非侮辱性的概率) / P(‘My’ 在留言中出現的概率(時候) X ‘Dog’在留言中出現的概率…)

總結

樸素貝葉斯
通過對每一個事件進行概率的判斷,如果某一個事件概率大,那麼結果就趨向於它

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章