機器學習 - 貝葉斯分類算法

原創

2018-08-21 01:54

1.貝葉斯定理(Bayes' theorem)

描述的是關於隨機事件A和B的條件概率。一般情況下，事件A和在事件B發生的條件下的概率，與事件B在時間A發生的條件下的概率是不同的，但這兩者之間是存在一定的關係的，貝葉斯定理描述的就是這種關係。記L(A|B)在B發生的條件下A發生的概率。

術語：
(1) p(A)事件A發生的概率

(2) p(A|B)在事件B發生的條件下，A發生的概率

(3) p(B|A)在事件A發生的條件下，B發生的概率

(4) p(B)事件B發生的概率

(5) p(AB)事件A和事件B同時發生的概率

Base formula：
P(A|B) = p(AB)/p(B)

Bayes' theorem:

p(B|A) = p(A|B)p(B)/p(A)

2.樸素貝葉斯分類(Naive Bayes)

待分類項：x = {a1, a2, ..., an}爲一個待分類項，其中每個a爲x的一個特徵屬性

類別集合：C = {y1, y2, ..., ym}

Naive Bayes Classification計算過程：

階段一：數據準備

(1) x，其特徵屬性爲a1, a2, ..., an

(2) 樣本集：(x1, x2, ..., xk)

階段二：訓練階段

(1) 計算每個類別發生的概率p(yi)

(2) 計算各個類別下各個特徵屬性的條件概率p(aj/yi)

階段三：預測階段

(1) 計算樣本屬於每個類別的概率p(x|yi)p(yi)

(2) 取最大項作爲x的類別max(p(x|yi)p(yi))

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.