一、樸素貝葉斯
樸素貝葉斯的前提是特徵之間沒有關聯。
公式爲:
舉例例子理解:
x:某些詞彙,y:垃圾郵件或者正常郵件,p(x|y):當是垃圾郵件或者正常郵件時,某些詞彙出現概率,p(y):垃圾郵件或正常郵件的概率,p(x):某些詞彙的概率。p(x|y),p(y)和p(x)叫做先驗概率,p(y|x)叫做後驗概率
因爲X爲集合,所以公式改爲:
是求積符號。
垃圾郵件和正常郵件也可以用0,1表示,公式改寫爲:
y有0和1兩種取值。
二、貝葉斯網絡
貝葉斯網絡的出現就是解決特徵之間有關聯。它包含結構和參數,是一個有向無環圖,用到聯合概率公式。
貝葉斯網絡構建方法
- 專家人爲的構建
- 機器用數據訓練,自己構建
- 專家和機器用數據,一起構建