李航統計學習方法第一章習題參考答案

1.1說明伯努利模型的極大似然估計以及被壓死估計中的統計學習方法三要素。

統計學習三要素：模型、策略和算法。

伯努利模型的極大似然估計

	模型	策略	算法
極大似然估計	條件概率	經驗風險最小化	求解析解
貝葉斯估計	條件概率	結構風險最小化	求數值解

伯努利模型是定義在取值爲0和1的隨機變量上的概率分佈。

$\begin{aligned}& P(Y=1) = \Theta \\ &P(Y=0) = 1-\Theta \end{aligned}$

極大似然估計：

似然函數的對數：

$\begin{aligned}log(L(\Theta ))&=log( \prod_{i=1}^{ N}P(Yi)) \\&=log( \Theta^{k}(1-\Theta )^{n-k} )\\&=klog(\Theta )+(n-k)log(1-\Theta ) \end{aligned}$

其中，n爲實驗次數，k爲n次實驗中結果爲1的次數，Yi表示第i次實驗的結果。

令對數似然的導數爲0可以直接求出解析解：

$\Theta =\frac{k}{n}$

貝葉斯估計：

$P(\Theta |Y1,Y2,...,Yn) = \frac{P(Y1,Y2,...,Yn|\Theta )*P(\Theta)}{P(Y1,Y2,..,Yn)}$

根據先驗概率 $P(\Theta )$ 和估計後驗概率，使後驗概率最大化。

1.2證明：模型是條件概率分佈，當損失函數是對數損失時，經驗風險最小化等價於極大似然估計。

首先需要理解幾個概念，條件概率分佈，對數損失，經驗風險和極大似然估計。

模型是條件概率分佈，說明預測值：

$f(X)=P(Y|X)=\frac{P(X,Y)}{P(X)}$

對數損失的定義爲：

$L(Y,P(Y|X))=-\log P(Y|X)$

此時，經驗風險R爲：

$\begin{aligned} R&=\frac{1}{N}* \sum_{i=1}^{N}L(Yi,f(Xi)) \\ &=\frac{1}{N}*\sum_{i=1}^{N}L(Yi,P(Yi|Xi)) \\&= \frac{1}{N}*\sum_{i=1}^{N}L(-log(P(Yi|Xi))) \\& = - \frac{1}{N}*log(\prod _{i=1}^{N}\frac{P(Xi,Yi)}{P(Xi)}) \end{aligned}$

所以，最小化經驗風險R，相當於最大化似然估計

$log(\prod _{i=1}^{N}\frac{P(Xi,Yi)}{P(Xi)})$

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

李航統計學習方法第一章習題參考答案

1.1說明伯努利模型的極大似然估計以及被壓死估計中的統計學習方法三要素。

1.2證明：模型是條件概率分佈，當損失函數是對數損失時，經驗風險最小化等價於極大似然估計。

利用kaggle的API將數據集直接下載到Google Colab

算法分析--遞歸與分治--快速排序

UCI銀行營銷數據集--缺失值處理方法

配置latex環境（Atom+texlive）

李航統計學習方法第一章習題參考答案

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

李航 統計學習方法 第一章 習題 參考答案

1.1說明伯努利模型的極大似然估計以及被壓死估計中的統計學習方法三要素。

1.2證明：模型是條件概率分佈，當損失函數是對數損失時，經驗風險最小化等價於極大似然估計。

李航統計學習方法第一章習題參考答案