統計學習第一章習題

原創

2018-08-30 13:49

1.1通過極大似然估計或貝葉斯估計來估計結果爲1的概率
解：
極大似然估計：
對於伯努利模型，假設 $P (x = 1) = θ$ ,於是我們可以得到它的條件分佈爲 $P (x | θ) = θ^{x} (1 - θ)^{1 - x}$ 。於是我們得到似然函數

\begin{aligned} L (θ) & = \prod_{i = 1}^{n} P (x_{i}) \\ = \prod_{i = 1}^{n} θ^{x_{i}} (1 - θ)^{1 - x_{i}} \end{aligned}

令

\frac{\partial L (θ)}{\partial θ} = 0

,我們就可以得到

θ = \frac{k}{n}

。也就是在這個值下面似然函數取的最大值，於是結果爲1的概率就是

\frac{k}{n}

。

1.2問題：通過經驗風險最小化推導極大似然估計：證明模型是條件概率分佈，當損失函數是對數損失函數時，經驗風險最小化等價於極大似然估計。

解：
如果模型是條件概率分佈的話，表示爲 $P_{θ} (Y | X)$ .
當損失函數是對數損失函數時： $L (Y, P (Y | X)) = - l o g (P (Y | X))$
經驗風險爲：

\begin{aligned} R_{e m p} (f) & = \frac{1}{N} \sum_{i = 1}^{N} L (y_{i}, f (x_{i})) \\ = \frac{1}{N} \sum_{i = 1}^{N} - l o g (p (y_{i} | x_{i})) \\ = - \frac{1}{N} \sum_{i = 1}^{N} l o g (p (y_{i} | x_{i})) \end{aligned}

根據上面的公式我們可以得到經驗風險最小化，等價於極大似然估計。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

條件隨機場(3)——學習和預測

看了兩天理論，終於輪到學習和預測上了。下載安裝了CRF++-0.58，準備程序分析來理解CRF的主要過程。 CRF++算法源程序是C++編寫的，主要的原生接口有三個：學習和預測用的crf_learn和crf_test，供其他語言

2020-07-05 15:00:45

樸素貝葉斯（待補充貝葉斯網絡）

一、條件概率公式： P(A∣B)=P(AB)P(B)P(A|B)=\frac{P(AB)}{P(B)}P(A∣B)=P(B)P(AB) 指的是在事件B發生的條件下事件A發生的概率二、全概率公式目標是求“最後結果”的概率,

weixin_43249938

2020-06-30 22:08:04

統計學習方法之邏輯迴歸(Logistic Regression)

邏輯迴歸之所以叫邏輯是因爲他用到了邏輯分佈: 圖形如下：還是按照老樣子，根據李航老師的統計學習方法三部分進行學習。 1 模型假設輸入爲任意範圍內的屬性值，輸出爲0－1之間的概率。給定一個閾

约瑟夫的杂货店

2020-06-29 23:32:50

SIFT原理

轉載請註明出處：http://blog.csdn.NET/luoshixian099/article/details/47377611 相關： KD樹+BBF算法解析 SURF原理與源碼解析

约瑟夫的杂货店

2020-06-29 23:32:39

《統計學習》筆記（2）-- EM算法

EM算法（1）EM算法是一種迭代算法，用於含有隱變量的概率模型參數的極大似然估計，或極大後驗概率估計。（2）EM算法的每次迭代由兩步組成：E步，求期望；M步，求極大。所以這一算法稱爲期望極大算法，簡稱EM算法。（3）觀

2020-06-29 04:02:06

CNN卷積神經網絡之卷積運算的初步理解

上述的卷積方式是帶有反轉的卷積，而不帶反轉的卷積操作稱爲互相關卷積，在進行卷積的過程中需要指明屬於哪一種卷積。對於5.6式子中，如果i，j分別取1，很明顯會出現x取到-1位置的情況，我個人理解是可能這個時候的卷積就屬於無效卷積了，因

2020-06-28 23:56:31

第二章-感知機

看完上一章的概要學習後，開始就進入第二章的內容——感知機。對於統計學習方法而言，包含三要素，模型+策略+算法，接下來就從以下三個要素全面瞭解感知機。感知機模型簡單來說，感知機（Perceptron）針對的是二分類的線性模型，其

2020-06-27 05:11:46

統計學習方法課後習題【第十章】

目錄 HMM code exercise 10_1: 後向算法 exercise 10_2:單個狀態的概率計算 exercise 10_3:viterbi算法求最有路徑 HMM 的代碼實現和部分課後練習運行結果 HMM code

2020-06-26 17:24:36

統計學習方法——第2章感知機模型編程實現

在上一篇統計學習方法———第2章感知機模型中介紹了感知機學習模型、策略和算法，這裏通過編程實現對iris數據集的萼片長度（sepal length）和萼片寬度（sepal width）進行線性分類。 Iris 鳶

2020-06-25 22:04:32

統計學習方法——第4章樸素貝葉斯法

樸素貝葉斯法（naive Bayes）：樸素貝葉斯法是基於貝葉斯理論與特徵條件獨立假設的分類方法。對於給定的數據集，基於特徵條件獨立假設學習輸入/輸出的聯合概率分佈，然後基於此模型，對給定的輸入，利用貝葉斯定理求解最大化

2020-06-25 22:04:30

【統計學習方法by李航】第二章感知機個人總結

第二章感知機一、感知機模型[2.1]（一）定義2.1(二)幾何解釋二、感知機學習策略[2.2]（一）數據集的線性可分型[2.2.1]（二）感知機學習策略[2.2.2]1、把點到直線距離公式擺上來，代入超平面方程2、爲了去掉絕對值

2020-06-25 01:23:29

【統計學習方法by李航】第一章統計學習方法概論個人總結

第一章統計學習方法概論開始的話一、統計學習 [1.1]（一）總定義（二）統計學習的方法二、監督學習[1.2]（一）基本概念[1.2.1]1、輸入空間、特徵空間與輸出空間2、聯合概率分佈3、假設空間（上面名詞解釋裏面有講）（二）問

2020-06-25 01:23:29

【統計學習方法by李航】第二章實踐——感知機

第二章實踐一、代碼：二、感知機，代碼解釋（有部分刪改）：三、自己寫的代碼，求出的w和b是差不多的，沒有用pandas和numpy 鏈接：[ 全文章目錄 ] 一、代碼：！！！第二部分代碼無法直接在python中運行，要在ju

2020-06-25 01:23:29

knn算法以及算法實現

1. knn算法定義：對於輸入變量x，尋找數據集中距離x最近的k個實例，這k個實例中哪個類的數量最多，就認爲輸入變量x屬於該類。 2.距離度量對於knn算法，我們一般選擇歐式距離作爲距離度量，當然，對於不同的問題，可能會有不同

2020-06-23 13:11:55

感知機算法及實現

感知機算法定義1：假設輸入空間是χ⊆Rn\chi \subseteq R^{n}χ⊆Rn,輸出空間爲γ\gammaγ={+1,-1}.輸入x∈χ\in \chi∈χ表示實例的特徵向量，對應於輸入空間的點；輸出y∈γy\in \g

2020-06-23 13:11:55

24小時熱門文章

最新文章

最新評論文章