一道有關極大似然估計和貝葉斯估計的題目

一道有關極大似然估計和貝葉斯估計的題目

本文地址:blog.lucien.ink/archives/500

0. 題目

數據 x1,,xnx_1, \dots, x_n 來自正態分佈 N(μ,σ2)N(\mu, \sigma ^ 2),其中 σ2\sigma ^ 2 已知。

  1. 根據樣本 x1,,xnx_1, \dots, x_n 寫出 μ\mu 的極大似然估計。
  2. 假設 μ\mu 的先驗分佈是正態分佈 N(0,τ2)N(0, \tau ^ 2),根據樣本 x1,,xnx_1, \dots, x_n 寫出 μ\mu 的貝葉斯估計。

1. 極大似然估計

正態分佈概率密度函數爲 f(x)=1σ2πe(xμ)22σ2{ f(x) = { \frac { 1 }{ \sigma { \sqrt { 2 \pi } } } } e ^{ - { \frac {( x - \mu )^{ 2 } }{ 2 \sigma^{ 2 } } } } },則

L(μ)=i=1nf(xi)=(1σ2π)ne12σ2i=1n(xiμ)212σ2i=1n(xiμ)2L(\mu) = \prod \limits_{ i = 1 }^{ n } f(x_i) = (\frac { 1 }{ \sigma \sqrt { 2 \pi } }) ^ n \cdot e ^ { - \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2 } \propto - \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2

則有 [12σ2i=1n(xiμ)2]μ=12σ2i=1n2(xiμ)=1σ2i=1n(xiμ)\frac{ \partial [- \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2] }{ \partial \mu } = \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } 2 \cdot (x_i - \mu) = \frac { 1 }{ \sigma ^ 2 } \sum \limits_{ i = 1 }^{ n } (x_i - \mu)

1σ2i=1n(xiμ)=0\frac { 1 }{ \sigma ^ 2 } \sum \limits_{ i = 1 }^{ n } (x_i - \mu) = 0

μ^=i=1nxin=xˉ\widehat \mu = \frac { \sum \limits_{ i = 1 }^{ n } x_i }{ n } = \bar x

2. 貝葉斯估計

大佬說這一問嚴格來講是求最大後驗概率估計

P(μ)=1τ2πeμ22τ2P(\mu) = { \frac { 1 }{ \tau { \sqrt { 2 \pi } } } } e^{ - { \frac { \mu ^ 2 }{ 2 \tau ^ 2 } } }

P(μx1,,xn)=P(μ)P(x1,,xnμ)P(x1,,xn)=P(μ)i=1nP(xiμ)P(μ,x1,,xn)dμP(\mu | x_1, \dots, x_n) = \frac{ P(\mu) \cdot P( x_1, \dots, x_n | \mu) }{ P(x_1, \dots, x_n) } = \frac{ P(\mu) \cdot \prod \limits_{ i = 1 }^{ n } P(x_i | \mu) }{ \int P(\mu, x_1, \dots, x_n) \mathrm{ d } \mu }P(μ)i=1nP(xiμ)=1τ2πeμ22τ2(1σ2π)ne12σ2i=1n(xiμ)2\propto P(\mu) \cdot \prod \limits_{ i = 1 }^{ n } P(x_i | \mu) = { \frac { 1 }{ \tau { \sqrt { 2 \pi } } } } \cdot e ^{ - { \frac { \mu ^ 2 }{ 2 \tau ^ 2 } } } \cdot (\frac { 1 }{ \sigma \sqrt { 2 \pi } }) ^ n \cdot e ^ { - \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2 }

取對數得 ln(1τ2πeμ22τ2(1σ2π)ne12σ2i=1n(xiμ)2)\ln({ \frac { 1 }{ \tau { \sqrt { 2 \pi } } } } \cdot e ^{ - { \frac { \mu ^ 2 }{ 2 \tau ^ 2 } } } \cdot (\frac { 1 }{ \sigma \sqrt { 2 \pi } }) ^ n \cdot e ^ { - \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2 })=ln1τ2πμ22τ2+nln1σ2π12σ2i=1n(xiμ)2 = \ln{ \frac { 1 }{ \tau { \sqrt { 2 \pi } } } } - { \frac { \mu ^ 2 }{ 2 \tau ^ 2 } } + n \cdot \ln \frac { 1 }{ \sigma \sqrt { 2 \pi } } - \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2μ22τ212σ2i=1n(xiμ)2\propto - { \frac { \mu ^ 2 }{ 2 \tau ^ 2 } } - \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2

則有 [μ22τ212σ2i=1n(xiμ)2]μ=μτ2+1σ2i=1n(xiμ)\frac { \partial [- { \frac { \mu ^ 2 }{ 2 \tau ^ 2 } } - \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2 ] }{ \partial \mu } = - { \frac { \mu }{ \tau ^ 2 } } + \frac { 1 }{ \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu)

μτ2+1σ2i=1n(xiμ)=0- { \frac { \mu }{ \tau ^ 2 } } + \frac { 1 }{ \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) = 0

則有 1σ2i=1nxinσ2μ=μτ2\frac { 1 }{ \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } x_i - \frac { n }{ \sigma ^ 2 } \mu = \frac { \mu }{ \tau ^ 2}1σ2i=1nxi=(1τ2+nσ2)μ=σ2+nτ2τ2σ2μ\Rightarrow \frac { 1 }{ \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } x_i = (\frac { 1 }{ \tau ^ 2} + \frac { n }{ \sigma ^ 2 }) \cdot \mu = \frac { \sigma ^ 2 + n \tau ^ 2 }{ \tau ^ 2 \sigma ^ 2 } \mu

μ^=τ2i=1nxiσ2+nτ2=i=1nxiσ2τ2+n\widehat \mu = \frac{ \tau ^ 2 \sum \limits_{ i = 1 }^{ n } x_i }{ \sigma ^ 2 + n \tau ^ 2 } = \frac{ \sum \limits_{ i = 1 }^{ n } x_i }{ \frac{ \sigma ^ 2 }{ \tau ^ 2 } + n }

3. 疑問與解答

3.1 μ\mu 是個參數,爲什麼會有分佈函數

考慮這樣一種情況,總共有 10001000 個隨機數字,每次有放回從中抽出 1010 個數字,抽 100100 次,就有 100100μ\mu,這些 μ\mu 服從同一種且擁有相同參數的分佈。

3.2 如何理解 P(x1,,xnμ)P(x_1, \cdots, x_n | \mu)P(μx1,,xn)P(\mu | x_1, \cdots, x_n)μ\mu 所表達的含義

μ\mu 取某個值發生的概率。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章