Note:本篇博文1,2部分主要是對書籍Pattern Recognition and Mechine Learning 第九章9.2節的翻譯
高斯混合模型
高斯混合模型是幾個高斯成分的簡單線性疊加,可以提供比單高斯更加豐富的密度模型。
高斯模型的形式:
這就表示此模型是由K個高斯分佈線性疊加而成。
高斯混合模型公式的推導
引入一個K維的二進制隨機變量z,其中只有一個元素
因爲z是1-K維的表示,所以其分佈可以寫爲
同樣的,在確定了z後x的條件概率是一個高斯分佈
也可以寫成:
由此得
後驗概率
另外一個具有重要作用的度量是x確定時z的條件概率。我們可以使用
我們可以把
最大似然
假定一觀測樣本集
高斯分佈的EM算法
更新參數
對上面的對數似然函數關於
兩側乘
對數似然函數關於
最後,我們關於混合係數
對
最終得到(這裏我推導不出來)
算法步驟
給一個高斯混合模型,我們的目標是最大化與參數(高斯成分的均值,協方差和混合係數)相關的對數似然函數。
1 Initialization
舒適化均值
2 E step
利用當前參數計算
3 M step
重新估計參數
其中:
4 計算log likelihood
檢查參數或者對數似然函數的收斂性。如果不滿足收斂準則,返回第二步。