貝葉斯估計

原創

2020-02-20 13:33

貝葉斯估計

標籤：模式分類

@author lancelot-vim

類條件密度

這個公式告訴我們，我們需要用已有的數據確定類條件概率密度p(x⃗ |wi,D) 和先驗概率P(wi|D) ，通常計算P(wi|D) 是很容易的，即頻率等於概率balabala就可以算出這個概率值來，但是類條件概率密度並不是那麼容易的，實際上，對於每個樣本，僅僅只有同一類別的樣本對於該類別的類條件密度是有意義的

因此，我們處理的核心問題，實際上是根據一組訓練樣本Di ，估計分佈p(x⃗ |Di) ，簡單記Di 爲D ,p(x⃗ |Di) 爲p(x⃗ |D)

參數的分佈

我們總是認爲分佈p(x⃗ ) 的形式是已知的，但是參數θ⃗ 並不知道，實際上我們需要做的事，是根據數據的到最好的θ⃗ 。

這個公式是貝葉斯估計的核心公式，他把類條件密度和後驗概率相結合，將這個問題劃歸爲一個優化後驗概率密度p(θ⃗ |D) 的問題。假如這個後驗密度在某個值θ^ 附近形成一個尖峯（最後收斂到狄拉克雷函數），那麼自然有p(x⃗ |D)≈p(x⃗ |θ^) ，假如沒有收斂，甚至可能形成了一個平均，that’s fine，我們可以認爲p(x⃗ |D) 是一種概率意義上的加權平均值

高斯情況

我們考慮期望u 未知的情況，即: p(x|u)∼N(u,σ2) ，σ 已知
我認爲所有關於均值u 的知識全部包含在先驗概率密度函數p(u)∼N(u0,σ20) 中，其中u0,σ0 均已知

根據高斯分佈密度函數，可以得到
p(u|D)=αΠnk=112π√σexp[−12(xk−uσ)2]exp[−12(u−u0σ0)2] =α′exp[−12[(nσ2+1σ2)u2−2(1σ2∑nk=1xk+u0σ20)]] =12π√σnexp[−12(u−unσn)2]

其中1σ2n=nσ2+1σ20,unσ2n=nσ2u^n+u0σ20(u^n=1nΣnk=1xk)

最後解得：
un=nσ20nσ20+σ2u^n+σ2nσ20+σ2u0
σ2n=σ20σ2nσ20+σ2

對於多變量情形，類似有

u⃗ n=Σ0(Σ0+1nΣ)−1u^n+1nΣ(Σ0+1nΣ)−1u0
Σn=Σ0(Σ0+1nΣ)−11nΣ

最後根據公式(1)，實際上可以的到p(x⃗ |D)∼N(u⃗ n,Σ+Σn)

貝葉斯參數估計一般理論

基本假設

條件概率p(x|θ) 是完全已知的，雖然參數θ 值未知
參數θ 的先驗概率密度函數p(θ) 包含了我們對θ 的所有先驗知識
觀測到的樣本獨立同分布

遞歸算法

最大似然估計和貝葉斯估計的區別

對於先驗概率能保證問題有解的問題下，最大似然估計和貝葉斯估計在訓練樣本趨於無窮大時候效果是一樣的。

計算複雜度

最大似然估計是比較好的選擇，因爲最大似然估計只涉及到微分運算或梯度搜索，而貝葉斯估計需要複雜的多重積分

可理解性

最大似然估計比貝葉斯方法更容易理解，因爲最大似然估計是基於設計者的設計和給出的樣本的到的最佳解答，而貝葉斯方法的結果是許多可行解答的加權平均，可以反映出對多種可行解答的不確定程度

對先驗知識的信任

最大死然估計得到的估計結果初始假設是一樣的，但對於貝葉斯估計未必成立。通過使用全部p(x⃗ |D) 中的信息，貝葉斯方法比最大似然方法能利用更多的信息，如果這些信息是可靠的，那麼貝葉斯方法能得到更可靠的結果。而且，即使沒有特定的先驗知識請跨下，貝葉斯估計也能的到和最大似然估計相似的結果

lancelot_vim

發佈了21 篇原創文章 · 獲贊 15 · 訪問量 10萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

貝葉斯估計

貝葉斯估計

類條件密度

參數的分佈

高斯情況

對於多變量情形，類似有

貝葉斯參數估計一般理論

基本假設

遞歸算法

最大似然估計和貝葉斯估計的區別

計算複雜度

可理解性

對先驗知識的信任

概述，貝葉斯策略，最大似然估計

貝葉斯估計

隱馬爾可夫模型的計算

流形上的預積分

非參數估計

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結