Bayes定理與應用

找了幾篇文章。
http://www.ruanyifeng.com/blog/2011/08/bayesian_inference_part_one.html
http://www.ruanyifeng.com/blog/2011/08/bayesian_inference_part_two.html
https://www.zhihu.com/question/19725590   ## 這個用頻率舉例,容易理解
http://norvig.com/spell-correct.html   ## 一個簡易的拼寫檢查Python版本

P(A|B) = P(B|A)*P(A) / P(B)

例子-01
看了這麼多答案,怎麼沒有人提平行宇宙解釋。我忘記是不是在《黑客與畫家》中看到的了。容我在此複述一下。
假設有1000個平行宇宙,這些宇宙中時間同步前進。
這一天,管理員小王天起牀,走到車間。此時有750個宇宙,這機器都是好的。而另有250個宇宙,機器是壞的。
但是在所有的宇宙中,小王都忘記檢查機器了(100%忘記檢查的人物設定),然後機器開工,生產了一個產品。
我們看這750個良好機器的宇宙中,有90%的宇宙,也就是675個宇宙,都產生了好產品,而75個宇宙,生產了壞的產品。
我們再看這250個故障機器的宇宙中,有30%的宇宙,也就是75個宇宙生產了好產品,有175個宇宙生產了壞產品。
在那些生產了好產品的宇宙中,小王此時纔想起來檢查機器。生產好產品的宇宙一共有675+75 = 750 個宇宙,其中675 個宇宙是良好機器的宇宙,另外75 個宇宙是故障機器的宇宙。

問,此時(生產了好產品時)發現故障機器的概率?
豈不是太簡單。
75/750 = 0.1

例子-02
作者:羅朝輝
鏈接:https://www.zhihu.com/question/19725590/answer/32275564
來源:知乎
著作權歸作者所有,轉載請聯繫作者獲得授權。

示例示例一:應當根據新情況更新先驗概率

決策與判斷》第十二章中講到人們都有保守主義情結,即使出現了新信息,也不願意根據新信息來更新先驗概率。用前面解釋裏面的話說就是:新信息是 B 事件不斷髮生,人們本應該根據這個信息去更新 A 事件發生的概率,但人們卻更願意固守之前估計的 A 事件發生的概率。


書中舉了這樣一個調查案例:

假設有兩個各裝了100個球的箱子,甲箱子中有70個紅球,30個綠球,乙箱子中有30個紅球,70個綠球。假設隨機選擇其中一個箱子,從中拿出一個球記下球色再放回原箱子,如此重複12次,記錄得到8次紅球,4次綠球。問題來了,你認爲被選擇的箱子是甲箱子的概率有多大?

調查結果顯示,大部分人都低估了選擇的是甲箱子的概率。根據貝葉斯定理,正確答案是96.7%。下面容我來詳細分析解答。


剛開始選擇甲乙兩箱子的先驗概率都是50%,因爲是隨機二選一(這是貝葉斯定理二選一的特殊形式)。即有:

P(甲) = 0.5, P(乙) = 1 - P(甲);

這時在拿出一個球是紅球的情況下,我們就應該根據這個信息來更新選擇的是甲箱子的先驗概率:

P(甲|紅球1) = P(紅球|甲) × P(甲) / (P(紅球|甲) × P(甲) + (P(紅球|乙) × P(乙)))
P(紅球|甲):甲箱子中拿到紅球的概率
P(紅球|乙):乙箱子中拿到紅球的概率

因此在出現一個紅球的情況下,選擇的是甲箱子的先驗概率就可被修正爲:

P(甲|紅球1) = 0.7 × 0.5 / (0.7 × 0.5 + 0.3 × 0.5) = 0.7

即在出現一個紅球之後,甲乙箱子被選中的先驗概率就被修正爲:

P(甲) = 0.7, P(乙) = 1 - P(甲) = 0.3;

如此重複,直到經歷8次紅球修正(概率增加),4此綠球修正(概率減少)之後,選擇的是甲箱子的概率爲:96.7%。

從程序運行結果來看,很明顯可以看到紅球的出現是增加選擇甲箱子的概率,而綠球則相反。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章