邱錫鵬神經網絡與深度學習習題2-6和2-7解答byMahomet

原創

2020-06-16 11:52

（pdf版本：30September2019）

2-6：

（1）根據定義，極大似然估計應有：

$argmax p(x|\mu,\sigma^2)=L(\mu,\sigma^2)=\prod^n_{i=1}\frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{1}{2\sigma^2}(x^{(i)}-\mu)^2)$

因此，

$ln L \propto \sum^n_{i=1}(x^{(i)}-\mu)^2$

對其關於\mu求導並取0，可得

$\mu^{ML}=\frac{1}{n}\sum^n_{i=1}x^{(i)}$

(2)根據定義，最大後驗分佈應有：

$p(\mu|x,\sigma^2)=\frac{p(\mu,x|\sigma^2)}{\sum_\mu p(x,\mu|\sigma^2)} \propto p(x|\mu,\sigma^2)p(\mu,\sigma^2)$

所以，

$\mu^{MAP}=argmax_\mu p(x|\mu,\sigma^2)p(\mu;\sigma^2)$

而對乘積第二項，根據題目給的條件，

$logp_\mu_p_{anterior}=log p(\mu_0,\sigma^2_0) \propto (\mu-\mu_0)^2$

因此相比\mu^{ML}，\mu^{MAP}多了一項\mu-\mu_0。

2-7：

我的理解是，當N足夠多時，人們預先指定的先驗分佈 $p(\mu;\sigma^2)$ 就沒必要了，因爲前面一項 $p(x|\mu,\sigma^2)$ 類似經驗誤差隨着N的增大而減小那樣，變得不再隨\mu的取值擾動而擾動。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

邱錫鵬神經網絡與深度學習習題2-5解答byMahomet

pdf的版本式30September2019的然後根據對數似然函數，上式加對數並代入正態分佈具體表達式：把不含\omega的項提出來視作常係數（注意這裏的\sigma也與\omega無關）：然後參看式2.36 後面處理完全相同

2020-06-16 11:52:36

邱錫鵬神經網絡與深度學習習題2-1、2-2、2-3和2-4解答byMahomet

（pdf版本：30September2019） 2-1： 2-2：參考式2.36，可以將併入和，並形成新的和。可見肯定會影響迴歸結果。直觀上，這種權重還是爲的式放大和縮小不同語境下的重要性； 2-3：秩只能取行數或列數中較小的那個

2020-06-16 11:52:36

邱錫鵬神經網絡與深度學習習題第三章解答byMahomet

pdf的版本式30September2019的 3-1：決策平面的法向量不就是權重向量\omega嘛 3-2：略 3-3每次更新\omega的時候都有樣本特徵向量出現； 3-6：我覺得是可以的，因爲|sigma的取值範圍是0~1，而在這個

2020-06-16 11:52:36

邱錫鵬神經網絡與深度學習習題2-5解答byMahomet

pdf的版本式30September2019的然後根據對數似然函數，上式加對數並代入正態分佈具體表達式：把不含\omega的項提出來視作常係數（注意這裏的\sigma也與\omega無關）：然後參看式2.36 後面處理完全相同

2020-06-16 11:52:36

邱錫鵬神經網絡與深度學習習題2-1、2-2、2-3和2-4解答byMahomet

（pdf版本：30September2019） 2-1： 2-2：參考式2.36，可以將併入和，並形成新的和。可見肯定會影響迴歸結果。直觀上，這種權重還是爲的式放大和縮小不同語境下的重要性； 2-3：秩只能取行數或列數中較小的那個

2020-06-16 11:52:36

邱錫鵬神經網絡與深度學習習題第三章解答byMahomet

pdf的版本式30September2019的 3-1：決策平面的法向量不就是權重向量\omega嘛 3-2：略 3-3每次更新\omega的時候都有樣本特徵向量出現； 3-6：我覺得是可以的，因爲|sigma的取值範圍是0~1，而在這個

2020-06-16 11:52:36

邱錫鵬神經網絡與深度學習習題5-1和5-2解答byMahomet

2019-10-26 16:33:28

24小時熱門文章

最新文章

最新評論文章