最近在看高斯混合模型(Gaussian Mixture Model, GMM),涉及到高斯分佈的參數。爲此特意回顧了概率論的二維高斯分佈的相關概念,並分析了參數對二維高斯分佈曲面的影響。
1、多維高斯分佈的概率密度函數
多維變量 的聯合概率密度函數爲:
其中:
d:變量維度。對於二維高斯分佈,有d=2;
:各位變量的均值;
:協方差矩陣,描述各維變量之間的相關度。對於二維高斯分佈,有:
後文主要分析均值和協方差矩陣對二維高斯分佈的影響。
2、均值和協方差矩陣對二維高斯分佈的影響
2.1
2.2
2.3
2.4
2.5
3、總結
①均值表徵的是各維變量的中心,其對二維高斯曲面的影響較好理解,它使得整個二維高斯曲面在xoy平面上移動;
②對於協方差矩陣,對角線上的兩個元素,即 和 表徵的是x維和y維變量的方差,決定了整個高斯曲面在某一維度上的“跨度”,方差越大,“跨度”越大;
③協方差矩陣的斜對角線上面的兩個元素,即 和 ( = )表徵的是各維變量之間的相關性: >0說明x與y呈正相關(x越大,y越大),其值越大,正相關程度越大; <0呈負相關;否則不相關。