朴素贝叶斯学习笔记

naivebayes   朴素贝叶斯分类器原理


公式分解:

1.p(word|categroy)=p(分类category的文档中出现word的文档总数)/分类category总文档数

p(word|categroy)意思为在category分类中word出现的概率


2.p(doc|categroy)=p(word1|categroy)*p(word2|categroy)*...*p(wordn|categroy)

p(doc|categroy)文档属于某个分类的概率


3.p(categroy|doc)=p(doc|categroy)*p(categroy)/p(doc)

p(categroy|doc)  指定文档doc为categroy分类的概率



假如有十个分类,分别计算指定文档这个十个类的概率,即p(categroy|doc),值最大的就是这个文档的分类


推荐链接:http://www.jianshu.com/p/b8e0ae7cfa39


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章