PRML Chapter 9.2 Mixtures of Gaussians 混合高斯分布简介

原創

KevinIceFire

2020-06-16 06:56

单元高斯分布(The univariate Gaussian)，我们高中时就知道了，其表达式如下：

N(x|μ,σ2)=1(2πσ2)1/2exp{−12σ2(x−μ)2}

而多元高斯分布(Multivariate Gaussian Distribution)就是有多个参数控制的高斯分布，其均值是一个均值向量μ，设均值向量维度为D，而方差则是方差矩阵Σ，因此其表达式如下：

N(x|μ,Σ)=1(2π)D/21|Σ|1/2exp{−12(x−μ)TΣ−1(x−μ)}

书中P84，P111对於单个的高斯分布对数据建模的缺点作了描述。由於单个高斯模型是一个unimodal，意即模型只有一个最大值的(看到某页面上称之为“单模态”)(P84:has a single maximum)，所以如P111所说的，单个高斯模型表示能力很有限，当数据有两个峰时就没法很好表示啦。因此需要混合高斯分布。

设有K个高斯分布混合在一起，每一个高斯分布称为一个Component，那么混合高斯分布表达式为(这个表达式来自P111)：

p(x)=∑k=1KπkN(x|μk,Σk)

其中πk称为mixing coefficients，并且∑k=1Kπk=1

P430引入了一个二元随机变量z，它的表示方法跟多项分布的表示方法一样，都是1-of-K representation，即zk∈{0,1}并且∑kzk=1 (意即对于K维的向量z只有一个值是1，其他所有值都是0)，这样就可以用z来表示πk，它们之间的关系是p(zk=1)=πk。所以z的概率分布类似于多项分布的表示，即

p(z)=∏k=1Kπkzk 式9.10

(=πk当对应k的那个zk是1时，因为其他指数都是0)

已知z之后，x对于z的条件分布为

p(x|zk=1)=N(x|μk,Σk) 式9.11

根据P431页图模型(z->x)，x与z的联合概率为p(x,z)=p(z)p(x|z)，而将这个联合概率对x取边缘概率，就得到了如下(结合9.10和9.11)：

p(x)=∑zp(z)p(x|z)=∑k=1KπkN(x|μk,Σk)

这就是混合高斯分布表达式的推导过程。之所以要引入这个隐含变量z是为了引入EM算法，这个之后再说。

另一个重要变量是γ(zk)，表示当观察到x时它由第k个Component产生的概率，即γ(zk)=p(zk=1|x)，更具体的

γ(zk)=p(zk=1|x)=p(zk=1)p(x|zk=1)∑j=1Kp(zj=1)p(x|zj=1)

=πkN(x|μk,Σk)∑j=1KπjN(x|μj,Σj) 式9.13

这个式9.13后面介绍EM算法的时候要用到，这里先写一下。

P432讲的是从混合高斯分布Sample的过程，使用了图模型那章讲的ancestral sampling(P365)(其实就是根据图模型的拓扑结构依次sample随机变量值)。混合高斯分布的sample过程很简单(z->x)，现根据p(z)选择z，即选择第zk个Component，此时已知z，然后再sample p(x|z)，即式9.11啦，所以此时从第k个Component Sample 出来的x值已经和z无关了(z已知)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

PRML Chapter 9.2 Mixtures of Gaussians 混合高斯分布简介

关于游戏付费的一点想法

我通过CKA和CKS啦！

PRML Chapter 9.2 Mixtures of Gaussians 混合高斯分佈簡介

MFC菜單自動摺疊的問題

MFC中視圖分割（靜態分割和動態分割）和視圖間消息傳遞

100 的階乘末尾有多少個0?

cmake生成利用VTK庫類的visual studio 2010 MFC工程

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結