樸素貝葉斯（待補充貝葉斯網絡）

原創

weixin_43249938

2020-06-30 22:08

一、條件概率

公式：
$P(A|B)=\frac{P(AB)}{P(B)}$
指的是在事件B發生的條件下事件A發生的概率

二、全概率公式

目標是求“最後結果”的概率,由條件概率可得 $P(AB)=P(A|B)P(B)$
公式：
$P(A)=\sum_{i=1}^n{P(A|B_i)P(B_i)}$
其中 $B_1,B_2,...,B_n是樣本空間的劃分，A爲E的一個事件$

三、貝葉斯公式

$已知“最後結果”，求“某個事件”的概率，設樣本空間爲S。A爲E的一個事件，B_1,B_2,...,B_n$ 是S的劃分,則公式爲：
$P(B_i|A)=\frac{P(AB_i)}{P(A)}=\frac{P(A|B_i)P(B_i)}{P(A)}$
若B表示類別，A表示特徵則公式爲：
$P(類別|特徵)=\frac{P(特徵|類別)P(類別)}{P(特徵)}$
可解釋爲在當前特徵下是該類別的概率= $\frac{該類別中存在這一特徵的概率\times 該類別的概率}{該特徵的概率}$

四、樸素貝葉斯 (舉例)

在樸素貝葉斯中假定了每一個 $x_i$ 都相互獨立。具體地條件獨立假設是
$P(Y=c_k|X=x)=\prod_jP(X^{(j)}=x^{(j)}|Y=c_k)$
將該公式帶入貝葉斯公式中結果爲：
$P(Y=c_k|X=x)=\frac{P(Y=c_k)P(X=x|Y=c_k)}{\sum_{i=1}^kP(X=x|Y=c_k)}=\frac{P(Y=c_k)\prod_jP(X^{(j)}=x^{(j)}|Y=c_k)}{\sum_kP(Y=c_k)\prod_jP(X^{(j)}=x^{(j)}|Y=c_i)}$
因爲對於所有地 $c_k$ 分母都是相同的，所以
$y=argmaxP(Y=c_k)\prod_jP(X^{(j)}=x^{(j)}|Y=c_k)$

樸素貝葉斯法地學習與分類算法：

輸入：訓練集 $T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}$ 其中， $x_i=(x_i^{(1)},x_i^{(2)},...,x_i^{(n)})^T，x_i^{(j)}是第i個樣本的第j個特徵，x_i^{(j)}\in\{a_{j1},a_{j2},...,a_{jS_j}\}，a_{jl}$ 是第 $j$ 個特徵值可能取的第 $l$ 個值，實例特徵向量 $x$ ；
輸出：實例 $x$ 所屬的類 $y$ .
（1）計算先驗概率及條件概率
$P(Y=c_k)=\frac{\sum_{i=1}^NI(y_i=c_i)}{N}$
$P(X^{j}=a_{jl}|Y=c_k)=\frac{\sum_{i=1}^NI(x_i^{(j)}=a_{ij},y_i=c_k)}{\sum_{i=1}^NI(y_i=c_k)}$
$j=1,2,...,n;l=1,2,...,S;k=1,2,...,K$
（2）對於給定的實例 $x=(x^{1},x^{2},...,x^{n})^T$ ，計算
$P(Y=c_k)\prod_jP(X^{(j)}=x^{(j)}|Y=c_k)，k=1,2,...K$
（3）確定x的類：
$y=argmaxP(Y=c_k)\prod_jP(X^{(j)}=x^{(j)}|Y=c_k)$

五、貝葉斯估計

由於使用最大似然估計時可能會出現估計概率爲0的情況。這樣會影響到後驗概率的計算結果，爲解決這一問題的方法是採用貝葉斯估計。具體的，條件概率的貝葉斯估計是：
$P_{\lambda}(X^{j}=a_jl|Y=c_k)=\frac{\sum_{i=1}^NI(x_i^{(j)}=a_{ij},y_i=c_k)+\lambda}{\sum_{i=1}^NI(y_i=c_k)+S_j\lambda}$
其中 $\lambda\geq0.$ 等價於在隨機變量各個取值的頻數上賦予一個正數 $\lambda>0.當\lambda=0時就是極大似然估計。常取\lambda=1，$ 這是稱爲拉普拉斯平滑。顯然對任何 $l=1,2,...,S_j，k=1,2,...,K，有$
$P_{\lambda}(X^{j}=a_jl|Y=c_k)>0$
$\sum_{l=1}^{S_j}P(X^{(j)}=a_{jl}|Y=c_k)=1$
同樣的，先驗概率的貝葉斯公式爲：
$P(Y=c_k)=\frac{\sum_{i=1}^NI(y_i=c_i)+\lambda}{N+K\lambda}$

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

樸素貝葉斯（待補充貝葉斯網絡）

一、條件概率

二、全概率公式

三、貝葉斯公式

四、樸素貝葉斯 (舉例)

五、貝葉斯估計

linux安裝cuda和cudnn

模擬手機設備：使用 Playwright 實現移動端自動化測試

Mellanox網卡開啓SR-IOV

測試人員都是畫畫大神，讓我看看誰還不會用代碼圖？

Object.values()對象遍歷

我拍了拍Redis，被移出了羣聊···

網絡現代化通向雲原生應用的高速公路

面試官：說說你對序列化的理解

我宣佈，這是我找到的史上AI最全論文體系！

樸素貝葉斯（待補充貝葉斯網絡）

《Random Walk based Entity Ranking on Graph for Multidimensional Recommendation》論文閱讀

機器學習筆記——緒論

洛谷[P1004]方格取數

Bellman-Ford算法（有向圖）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結