終於到了貝葉斯估計這章了,貝葉斯估計在我心中一直是很重要的地位,不過發現書中只用了不到10頁介紹這一章,深度內容後,發現貝葉斯估計的基礎公式確實不多,但是由於正態分佈在生活中的普遍性,貝葉斯估計才應用的非常多吧!
默認輸入變量用X表示,輸出變量用Y表示
概率公式描述:
P(X=x):表示當X=x時的概率
P(X=x∣Y=ck):表示當Y=ck時,X=x的概率
貝葉斯法則:P(Yi∣X)=∑jP(X∣Yj)P(Yj)P(X∣Yi)P(Yi)
1、什麼是先驗概率、後驗概率?
先驗概率(prior probability)是指根據以往經驗和分析得到的概率,如全概率公式,它往往作爲"由因求果"問題中的"因"出現的概率。
後驗概率是信息理論的基本概念之一。在一個通信系統中,在收到某個消息之後,接收端所瞭解到的該消息發送的概率稱爲後驗概率。
比如你拋了10次硬幣,7次正面朝上,接下來問你正面朝上的概率是多少,你說70%,此時這個就是先驗概率,它是我們從“以往”的經驗中積累得到的。
- 條件獨立性假設公式:P(X=x∣Y=ck)=j=1∏nP(X(i)=x(j)∣Y=ck)
後驗概率一般是在已知先驗概率的前提下,通過貝葉斯定理計算得到的。
- 後驗概率計算公式:P(Y=ck∣X=x)=∑kP(X=x∣Y=ck)P(Y=ck)P(X=x∣Y=ck)P(Y=ck)
把條件獨立性假設公式代入有P(Y=ck∣X=x)=∑kP(Y=ck)∏jP(X(i)=x(j)∣Y=ck)P(Y=ck)∏jP(X(i)=x(j)∣Y=ck)
可以得到樸素貝葉斯分類器公式爲:
- 樸素貝葉斯分類器:y=argckmaxP(Y=ck)j∏P(X(i)=x(j)∣Y=ck)
2、什麼是極大似然估計?
通俗解釋:先估計一下模型的參數,然後計算得到實驗結果的概率,概率越大,那麼這個參數就可能越接近真實值。
- 先驗概率P=(Y=ck)的極大似然估計:P(Y=ck)=N∑i=1NI(yi=ck),k=1,2,...,K公式中的I(yi=ck)可以理解爲是能夠通過已知的時間結果中計算的概率,稍後可以通過第3題知道究竟是什麼。
- 設第j個特徵可能取值的集合爲{aj1,aj2,...,ajSj},條件概率P(Xj=ajl∣Y=ck)的極大似然估計是:P(X(j)=ajl∣Y=ck)=∑i=1NI(yi=ck)∑i=1NI(xi(j)=ajl,yi=ck)j=1,2,...,n;l=1,2,...,Sj;k=1,2,....,K其中,xi(j)是第i個樣本的第j個特徵;ajl是第j個特徵可能取得第l個值;I爲指示函數
3、試着由下表的訓練數據學習一個樸素貝葉斯分類器並確定x=(2,S)T的類標記y。表中X(1),X(2)爲特徵,取值的集合分別爲A1={1,2,3},A2={S,M,L},Y爲類標記,Y∈C={1,−1}。
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
X(1) |
1 |
1 |
1 |
2 |
2 |
2 |
3 |
3 |
3 |
X(2) |
S |
S |
M |
L |
L |
S |
S |
M |
L |
Y |
1 |
1 |
1 |
-1 |
-1 |
1 |
-1 |
-1 |
-1 |
4、貝葉斯公式及貝葉斯估計算法?
5、貝葉斯估計與極大似然估計方法的比較?