機器學習 - 貝葉斯分類算法

1.貝葉斯定理(Bayes' theorem)

描述的是關於隨機事件A和B的條件概率。一般情況下,事件A和在事件B發生的條件下的概率,與事件B在時間A發生的條件下的概率是不同的,但這兩者之間是存在一定的關係的,貝葉斯定理描述的就是這種關係。記L(A|B)在B發生的條件下A發生的概率。

術語:
(1) p(A)事件A發生的概率

(2) p(A|B)在事件B發生的條件下,A發生的概率

(3) p(B|A)在事件A發生的條件下,B發生的概率

(4) p(B)事件B發生的概率

(5) p(AB)事件A和事件B同時發生的概率

Base formula:
P(A|B) = p(AB)/p(B)

Bayes' theorem:

p(B|A) = p(A|B)p(B)/p(A)


2.樸素貝葉斯分類(Naive Bayes)

待分類項:x = {a1, a2, ..., an}爲一個待分類項,其中每個a爲x的一個特徵屬性 

類別集合:C = {y1, y2, ..., ym}


Naive Bayes Classification計算過程:

階段一:數據準備

(1) x,其特徵屬性爲a1, a2, ..., an

(2) 樣本集:(x1, x2, ..., xk)

階段二:訓練階段

(1) 計算每個類別發生的概率p(yi)

(2) 計算各個類別下各個特徵屬性的條件概率p(aj/yi)

階段三:預測階段

(1) 計算樣本屬於每個類別的概率p(x|yi)p(yi)

(2) 取最大項作爲x的類別max(p(x|yi)p(yi))

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章