深入理解什麼是Beta分佈


例一

Beta分佈是一種描述概率的概率分佈,這句話可能有些繞口,看一個例子:

以拋硬幣爲例,如果硬幣是均勻的,並且正面朝上的概率記爲p(p=0.5),那麼每一次拋硬幣都可以看做是一次伯努利實驗,它服從0-1分佈

如果我們把硬幣拋了n次,並且想要計算,在這n次當中,硬幣正面朝上的次數的概率,那麼它應該是服從 X~B(n,p) ,即二項分佈

二項分佈可以看做是多次重複進行伯努利實驗所得到的分佈。

但是,如果假設我們事先並不知道硬幣是否均勻,也就是說正面朝上的概率p是未知的,但顯然 p 仍在[0,1] 區間之間,在這種情況下,比方說我們拋硬幣10000次,其中正面朝上7000次,那麼可以得到 p = 0.7,但是顯然我們並不能肯定p就是0.7,如果我們再進行10000次拋硬幣實驗,可能正面朝上6000次,那麼p就等於0.6了。那麼,在多次重複進行二項分佈的實驗中,我們想要知道p的所有可能取值的概率,這就是一個Beta分佈。(因爲p就是描述正面朝上的概率,而Beta分佈描述的是p的概率,因此稱Beta分佈可以看做是一個概率的概率分佈)

正如二項分佈可以看做是重複進行伯努利實驗所得到的分佈,Beta分佈可以看做是重複進行二項分佈所得到的分佈。

通過例一,你可能已經對Beta分佈有了一個直觀的瞭解,接下來看例二。


例二

在進行例二之前,我們先引入Beta分佈,一般來說,我們可以將Beta分佈記爲Beta(a,b),其中a是成功的次數,b是失敗的次數。

同時,我們需要知道一些概念,在貝葉斯公式中,有:

在這裏插入圖片描述
這裏的 θ 是未知參數,data是樣本數據,P(θ|data)被稱爲後驗分佈,P(data|θ)被稱爲似然函數,P(θ) 被稱爲先驗分佈,作爲分母的P(data)因爲不涉及到θ,因此可以被視爲常數,不去考慮。

暫時知道這些就可以了。

仍以拋硬幣爲例,假設現在是在進行一場比賽,以拋硬幣得到正面朝上的次數最多的人獲勝。現有甲、乙兩個人蔘賽。

先驗分佈:

在比賽開始之前,我們假設對硬幣朝上的概率一無所知,一無所知就意味着任何概率都是等可能的,Beta(1,1)可以表示這樣的分佈:
在這裏插入圖片描述

甲選手比較正直,他使用的可能是均勻的硬幣,即得到正面或者反面的概率是一樣的,我們可以用Beta(5,5)來表示這樣的分佈:
在這裏插入圖片描述
這裏縱軸的值先不用去理會,我們看橫軸,可以看到p=0.5的概率最大,因爲甲選手使用的是均勻的硬幣。

乙選手善於使詐,他可能使用了作弊的硬幣,也就是說每拋一次硬幣幾乎都會得到正面朝上的結果,我們用Beta(5,1)來表示這樣的分佈:
在這裏插入圖片描述

後驗分佈:

用Beta分佈來模擬硬幣的先驗分佈後,通過貝葉斯估計,得到的後驗分佈依然是Beta分佈。

我們假設甲乙兩選手在比賽中各自拋了3次硬幣,甲選手三次均得到正面朝上,用Beta分佈來表示即:
在這裏插入圖片描述
可以看到圖像的中心右移了,儘管作弊可能性有所增加,但總體還是公平參賽的可能性大。

乙選手拋擲三次硬幣同樣得到三次正面朝上,那麼用Beta分佈表示即:
在這裏插入圖片描述
右移的更加厲害,幾乎已經可以確認乙選手作弊。

通過這個例子,相信你對Beta分佈會有一個更加深刻的認知。


Beta分佈的公式推導

在這裏插入圖片描述
關於伽馬函數

關於Beta函數與伽馬函數之間的關係式的那個推導:
在這裏插入圖片描述
在這裏插入圖片描述

Beta分佈的性質:
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述


共軛分佈與共軛先驗分佈:
在這裏插入圖片描述
Beta分佈是二項分佈的共軛先驗分佈。

參考:

如何通俗理解 beta 分佈? - 馬同學的回答 - 知乎

暴力推導 Beta 函數與 Gamma 函數關係式

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章