混合高斯模型（Mixtures of Gaussians）和EM算法

原創

2020-02-20 12:58

這篇討論使用期望最大化算法（Expectation-Maximization）來進行密度估計（density estimation）。

與k-means一樣，給定的訓練樣本是，我們將隱含類別標籤用表示。與k-means的硬指定不同，我們首先認爲是滿足一定的概率分佈的，這裏我們認爲滿足多項式分佈，，其中，有k個值{1,…,k}可以選取。而且我們認爲在給定後，滿足多值高斯分佈，即。由此可以得到聯合分佈。

整個模型簡單描述爲對於每個樣例，我們先從k個類別中按多項式分佈抽取一個，然後根據所對應的k個多值高斯分佈中的一個生成樣例，。整個過程稱作混合高斯模型。注意的是這裏的仍然是隱含隨機變量。模型中還有三個變量和。最大似然估計爲。對數化後如下：

這個式子的最大值是不能通過前面使用的求導數爲0的方法解決的，因爲求的結果不是close form。但是假設我們知道了每個樣例的，那麼上式可以簡化爲：

這時候我們再來對和進行求導得到：

就是樣本類別中的比率。是類別爲j的樣本特徵均值，是類別爲j的樣例的特徵的協方差矩陣。

實際上，當知道後，最大似然估計就近似於高斯判別分析模型（Gaussian discriminant analysis model）了。所不同的是GDA中類別y是伯努利分佈，而這裏的z是多項式分佈，還有這裏的每個樣例都有不同的協方差矩陣，而GDA中認爲只有一個。

之前我們是假設給定了，實際上是不知道的。那麼怎麼辦呢？考慮之前提到的EM的思想，第一步是猜測隱含類別變量z，第二步是更新其他參數，以獲得最大的最大似然估計。用到這裏就是：

循環下面步驟，直到收斂： {

（E步）對於每一個i和j，計算

（M步），更新參數：

}

在E步中，我們將其他參數看作常量，計算的後驗概率，也就是估計隱含類別變量。估計好後，利用上面的公式重新計算其他參數，計算好後發現最大化最大似然估計時，值又不對了，需要重新計算，周而復始，直至收斂。

的具體計算公式如下：

這個式子利用了貝葉斯公式。

這裏我們使用代替了前面的，由簡單的0/1值變成了概率值。

對比K-means可以發現，這裏使用了“軟”指定，爲每個樣例分配的類別是有一定的概率的，同時計算量也變大了，每個樣例i都要計算屬於每一個類別j的概率。與K-means相同的是，結果仍然是局部最優解。對其他參數取不同的初始值進行多次計算不失爲一種好方法。

雖然之前再K-means中定性描述了EM的收斂性，仍然沒有定量地給出，還有一般化EM的推導過程仍然沒有給出。下一篇着重介紹這些內容。

轉載自：http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006924.html

發佈了34 篇原創文章 · 獲贊 18 · 訪問量 15萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

使你更有思想的20本書

記下來，有空讀讀，這個很重要。歸到算法一欄，應該可以理解吧。 1.《斷層線》（Fault Lines）作者：拉古拉姆·拉詹美國芝加哥大學經濟學家 2.《大而不倒》（Too Big to Fall）作者：安德魯·羅

2020-07-08 08:39:02

找出會移動的獎品

問題：有n個瓶子，有一個獎品，遊戲者需要猜出獎品在哪個瓶子中。有n個黑色的瓶子（以至於遊戲中看不到瓶中是否有東西）設從0到n-1編號，一字排開。每一次如果遊戲者猜錯了，那麼獎品會各以50%的概率移動到左邊或者右邊的瓶子中。當獎品位於

2020-07-07 06:09:15

N個正整數連接成最大的數

題目：給出N個正整數，如 {7, 959, 95, 71, 1}，求將這些數連接起來所組成的最大的數，即959957711。變形：給出N個由0...9組成的字符串（開頭可能爲零），求將這些字符串連接起來，所組成的最大（最小）的數。

2020-07-07 05:31:23

出界的概率

問題：一個小島，表示爲一個N×N的方格，從(0,0)到(N-1, N-1)，一個人站在島上，位置(x, y)，他可以上下左右走，一步一個格子，他選擇上下左右的可能性是一樣的。當他走出小島，就意味着死亡。假設他要走k步，請問他死亡的概率有

2020-07-07 05:31:23

柱狀圖中找最大矩形 & 矩陣中找最大的僅含相同值的矩形區域

一、具體題目如下：給一組非負的整數來表示一個柱狀圖，設計一個算法獲得柱狀圖中最大矩形的面積。比如，輸入如下數據：2,1,5,6,2,3 ，其中每個數表示一個柱狀條的高度，柱狀條的寬度爲默認值1，則計算得最大矩形的面積爲10。 ==>

2020-07-07 05:31:23

歸併算法(java 語言實現)

這裏實現的是原地歸併。注意 aux 數組是實現原地歸併的輔助數組，如果在每一層遞歸的 merge 方法中都創建一個輔助數組將使空間複雜度變大。這就是爲什麼 private static Comparable[] aux;

2020-07-07 03:52:44

泛型歸併排序(java 語言實現)

以下實例實現了 1. 實現了Comparable 接口的基本類型的泛型排序， 2. 複雜或者說自定義對象的泛型排序，使用 Comparator 接口定製的比較器泛型歸併排序主要代碼 package com.shan.merge

2020-07-07 03:52:44

堆排序（java 語言實現）

可以用數組或者線性表實現 Heap ，關鍵是理清楚當前節點的座標和父節點的座標以及左右孩子的座標的關係，比如當前座標是 i 其他節點的座標如何表示。然後就是添加刪除的原則。 package com.shan.heapSor

2020-07-07 03:52:44

泛型快速排序（java 語言實現）

快速排序基本思想：http://blog.csdn.net/stushan/article/details/51172253 實現 Comparable 類型和定製類型的比較（要定義比較器） package com.shan.qu

2020-07-07 03:52:31

求遞歸式時間複雜度

當一個算法包含對自身的遞歸調用時，其運行時間通常可以用遞歸式(recurrence)來表示。解遞歸式，就是找出解的漸近“Θ”或“O”界的方法，

2020-07-06 03:58:01

回溯（Backtracking）

以下是我個人對回溯的理解。回溯，是嘗試列舉出所有解決問題的方法。即按照問題所給的操作方法，進行模擬，當在尋找解的過程中，發現不符合題意的解，返回至上一步，如此重複，直到尋找到滿足問題的解的過程。由於回溯過程會產生解空間

2020-07-05 22:37:38

也談漂亮代碼

看到負暄瑣話裏面的漂亮代碼，頗有同感。前一段就在TopCoder SRM345 Div1 250 Pathfinding上看到漂亮代碼的威力。先看看Spieler的代碼： class Pathfinding { public: i

2020-07-05 12:54:04

An Algorithm Summary of Programming Collective Intelligence (3)

繼續。 k-Nearest Neighbors kNN(不要問我叫什麼)PCI裏面用kNN做了一個價格預測模型，還有一個簡單的電影喜好預測。簡單來說就是要對一個東西做數值預測，就要先有一堆已經有數值的東西，從裏面找出和要預測的東西相似的

2020-07-05 12:54:04

HDOJ.1203-I NEED A OFFER!

動態規劃典型題- 我要offer！ Description Speakless很早就想出國，現在他已經考完了所有需要的考試，準備了所有要準備的材料，於是，便需要去申請學校了。要申請國外的任何大學，你都要交納一定的申請費用，這可是很驚人的。

坚持学习的你

2020-07-03 17:49:18

169-求衆數

169-求衆數題目描述示例思路代碼改良後的思路方法一方法二題目描述給定一個大小爲 n 的數組，找到其中的衆數。衆數是指在數組中出現次數大於 ⌊ n/2 ⌋ 的元素。你可以假設數組是非空的，並且給定的數組總是存在衆數。示例

2020-07-03 16:14:46

24小時熱門文章

最新文章

最新評論文章