混合高斯分布

单高斯模型

一维情况下高斯分布,概率密度函数,一个正态函数,分布都清楚。
下面这位作者给出的二维高斯分布图很形象,能快速理解
服从二维高斯分布的数据主要集中在一个椭圆内部
二维高斯分布(Two-dimensional Gaussian distribution)的参数分析
类比,服从三维的数据集中在一个椭球内部

混合高斯模型

假设混合高斯模型由K个高斯模型组成(即数据包含K个类),则GMM的概率密度函数如下:
在这里插入图片描述
在这里插入图片描述
是第k个高斯模型的概率密度函数,可以看成选定第k个模型后,该模型产生x的概率;
在这里插入图片描述
​ 是第k个高斯模型的权重,称作选择第k个模型的先验概率,且满足
在这里插入图片描述
所以,混合高斯模型并不是什么新奇的东西,它的本质就是融合几个单高斯模型,来使得模型更加复杂,从而产生更复杂的样本。理论上,如果某个混合高斯模型融合的高斯模型个数足够多,它们之间的权重设定得足够合理,这个混合模型可以拟合任意分布的样本。
下面一维高斯混合模型

在这里插入图片描述
可见,调整权重将极大影响混合模型的概率密度函数曲线。另一方面也可以直观地理解混合高斯模型可以更好地拟合样本的原因:它有更复杂更多变的概率密度函数曲线。理论上,混合高斯模型的概率密度函数曲线可以是任意形状的非线性函数。
如果需要知道二维混合高斯模型分布,这个作者讲述很好
详解EM算法与混合高斯模型(Gaussian mixture model, GMM)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章