樸素貝葉斯

首先是“樸素”一詞,代表的是假設各特徵之間相互獨立,互不影響,雖然如此,其實際表現也較爲不錯。

其原理大致如下:
假設一個二分類問題,評價一個女生漂亮與否,主要有如下指標:長髮與否,身高高矮,體型胖瘦,給出一個合適的數據集

現在有這樣一個女生,高,長髮,瘦,判斷這個女孩是否漂亮,即求

P(漂亮|高,長髮,瘦) = (P(高,長髮,瘦|漂亮) *  P(漂亮))  /  P(高,長髮,瘦)
P(不漂亮|高,長髮,瘦) = (P(高,長髮,瘦|漂亮) *  P(不漂亮))  /  P(高,長髮,瘦)

較大概率者即爲其分類,其分母都是相同的,所以只需要比較分析大小。

由於已經假設各特徵相互獨立、各不影響,故分子可簡化爲如下形式:
P(漂亮) * P(高|漂亮) * P(長髮|漂亮) * P(瘦|漂亮)

argmax一下即得到結果

判別結果就不用我多說了吧!

還有一點就是會產生概率爲0的點 ,爲了避免出現這種情況,使用貝葉斯估計,通常參數爲1,即拉普拉斯平滑什麼什麼的,這地方還沒理解,後邊再補

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章