首先是“樸素”一詞,代表的是假設各特徵之間相互獨立,互不影響,雖然如此,其實際表現也較爲不錯。
其原理大致如下:
假設一個二分類問題,評價一個女生漂亮與否,主要有如下指標:長髮與否,身高高矮,體型胖瘦,給出一個合適的數據集
現在有這樣一個女生,高,長髮,瘦,判斷這個女孩是否漂亮,即求
P(漂亮|高,長髮,瘦) = (P(高,長髮,瘦|漂亮) * P(漂亮)) / P(高,長髮,瘦)
P(不漂亮|高,長髮,瘦) = (P(高,長髮,瘦|漂亮) * P(不漂亮)) / P(高,長髮,瘦)
較大概率者即爲其分類,其分母都是相同的,所以只需要比較分析大小。
由於已經假設各特徵相互獨立、各不影響,故分子可簡化爲如下形式:
P(漂亮) * P(高|漂亮) * P(長髮|漂亮) * P(瘦|漂亮)
argmax一下即得到結果
判別結果就不用我多說了吧!
還有一點就是會產生概率爲0的點 ,爲了避免出現這種情況,使用貝葉斯估計,通常參數爲1,即拉普拉斯平滑什麼什麼的,這地方還沒理解,後邊再補