參數估計(二)----極大後驗概率估計

Maximum a posteriori estimation(極大後驗概率估計),和ML(極大似然估計)相似,只不過是考慮了參數的先驗分佈。

還是貝葉斯公式:

極大後驗概率,顧名思義,即:

根據貝葉斯公式轉換一下,

注意:(1)在轉化的時候P(X)直接刪除了。(2)與極大似然估計的公式比較發現,多了一個先驗分佈項

通過加上這個先驗分佈項,我們可以編碼額外的信息,並且可以避免參數的過擬合問題。

我們認爲,theta也是服從一個先驗分佈的:alpha是他的超參數


和前面計算極大似然估計相同,求出上面的表達式之後,通過偏導數置爲0,求參數值:

求出參數值之後,當然接下來就要預測了,


接下來,我們再通過一個例子來加深理解:

還是上一篇講到的擲硬幣,只不過與ML不同的是,我們這裏考慮到了參數p的先驗分佈(即是正面的概率),我們認爲這個硬幣是均勻的,因此p 很大可能是約等於0.5的,因此,我們對參數p選擇了beta分佈,beta分佈的值介於0和1之間,因此可行:

其中a,b是超參數。

觀察上面的圖,因爲我們先驗認爲p約等於0.5,因此超參數a和b是相等的,我們這裏選擇等於5.


與ML方法相比,這裏分子分母上分別多了(a-1)和(a+b-2),我們稱這兩者爲pseudo count僞計數,這兩項的作用是使總概率p向0.5拉近,因爲我們的先驗認爲就是約等於0.5的。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章