背景
一共有三個門,門後分別放着兩隻羊和一輛車。選手並不知道哪個門後是什麼,隨機選擇一扇門後,主持人打開剩下兩個門中沒有車的一扇門。此時,主持人提問:選手是否更換自己的選擇?
如果你是選手,你換嗎?爲什麼?
最近瞭解到著名的“三門問題”,也通過程序模擬了多次試驗,結果也再次證實了條件概率的正確性。所以,我們是無法靠感性或者直覺判斷問題的,還是應該多多充實知識庫啦。
本節從條件概率、全概率,再到貝葉斯公式,最後回到“三門問題”上。
條件概率
P(A|B)=P(AB)/P(B)
現有事件A、事件B,如果事件B已發生,此時事件A發生的概率是多少?
即P(A|B)=?
用集合表示的話,更加直觀。
1)計算P(A)或者P(B)時,是以Ω爲樣本空間的。
2)而計算P(A|B)時,意味着P(B)已發生。即樣本空間已經從Ω變成了B。
當事件B已發生時,事件A如果要發生,就只能是在A∩B的部分,即P(AB)。
因此,P(A|B)=P(AB)/P(B)
小試牛刀:
一對夫妻有兩個小孩,已知其中一個是女孩,則另一個是女孩子的概率是多少?
假定B=兩個小孩中有一個是女孩 A=兩個小孩中有一個是女孩,因此,P(B)=P(A)=3/4 ,P(AB)=1/4,應用條件概率公式: P(A/B)=P(AB)/P(B)=1/3。
全概率公式
全概率公式,將一個複雜的事件,轉換爲在不同情況下的簡單事件概率的求解。
1、完備事件組
定義:
設S爲試驗E的樣本空間,B1,B2,…,Bn爲E的一組事件。若
(i)Bi ∩ Bj=∅ (i≠j且i、j=1,2,…,n);
(ii)B1∪B2∪…∪Bn=S,
則稱B1,B2,…,Bn爲樣本空間S的一個完備事件組。
簡單地說,可以理解成,一個完備事件組分割了樣本空間S。
2、全概率公式推導
事件A的完備事件組B1,B2,B3……Bn,且概率不爲0,因此,
P(A)=P(AB1)P(AB2)P(AB3)……P(ABn)
=P(A|B1)P(B1)P(A|B2)P(B2)P(A|B3)P(B3)……P(A|Bn)P(Bn)
=
貝葉斯定理
貝葉斯定理描述了事件 A 在事件 B 發生的條件下的概率,與事件 B 在事件 A 發生的條件下概率的關係。
表達式:P(A|B)=P(A)P(B|A)/P(B)
1、表達式推導
由條件概率公式得:
P(A|B)=P(AB)/P(B)
P(B|A)=P(AB)/P(A)
簡化,得:
P(A|B)P(B)=P(B|A)P(A)
P(A|B)=P(A)P(B|A)/P(B)
得證。
對於
先驗概率:在B事件發生前,此事件的概率已知,即P(A)。
後驗概率:在B事件發生之後,我們對事件A發生概率的再次估計。
貝葉斯另一公式證明,需結合全概率公式:
2、舉個栗子
經典三門問題:
一共有三個門,門後分別放着兩隻羊和一輛車。選手並不知道哪個門後是什麼,隨機選擇一扇門後,主持人打開剩下兩個門中沒有車的一扇門。此時,主持人提問:選手是否更換自己的選擇?
如果你是選手,你換嗎?爲什麼?
1)在主持人不打開門時,選手抽中車的概率爲1/3。
2)而在主持人打開門後,就涉及到條件概率的知識了。
由於選手抽中車的概率爲1/3,這個很簡單。但主持人打開哪個門是不確定的,主持人需要選擇不是車的那個門來打開。
因此,我們假定選手選擇第一扇門,而主持人打開第三扇門。
即:
A=選手選擇第一扇門,第一扇門中是車
B=選手選擇第一扇門,第二扇門中是車
C=選手選擇第一扇門,第三扇門中是車
D=主持人打開第三扇門
P(D|A)=1/2
P(D|B)=1
P(D|C)=0
P(A)=P(B)=P©=1/3
根據貝葉斯公式:
P(D)=P(A)P(D|A)+P(B)P(D|B)+P©P(D|C)=1/2
P(A|D)=P(A)P(D|A)/P(D)=1/3
P(B|D)=P(B)P(D|B)/P(D)=2/3
由此可見,當主持人打開第三扇門後,選手選擇第一扇門且抽中車的概率仍爲1/3,這與主持人是否打開第三扇門的概率相同。但第二扇門抽中車的概率就變成了2/3。
因此,對於選手來說,在主持人打開一扇門後,選手更換手中的選擇抽中車的概率更大。
擴展
此外,在機器學習中,還會接觸“樸素貝葉斯”。
作爲監督學習中基於概率論的分類算法,樸素貝葉斯是基於貝葉斯原理,其“樸素”一詞是包含兩種假設:一是數據特徵之間是獨立的,二是數據特徵是同等重要的。只有在這兩種假設成立的前提下,用貝葉斯公式去計算數據所屬的類別概率纔是比較合理的。
小結
貝葉斯公式並不是新的東西,是基於條件概率、全概率公式的推論和變種罷了。重要的是明確事件的概率有先驗概率和後驗概率之分。