背景
Global Semi-tied Covariance (STC)/Maximum Likelihood Linear Transform (MLLT) estimation
gmm建模方差使用對角矩陣的前提是假設特徵之間相互獨立,使用full或者block-diagonal矩陣可以對相關性的特徵建模,但是參數增多。爲了解決使用這個問題,有兩種方法:
- feature-space 使用DCT或者LDA去相關
- model-space 不同的模型可以使用不同的轉換,更靈活
semi-tied covariance matrices是model-space裏面的一種形式,也是爲了解決使用full covariance的參數量大的問題。相比於full covariance,這種方法的每個高斯分量有兩個方差矩陣:
1. diagonal covariance
2. semi-tied class-dependent nondiagonal matrix
最後的方差矩陣:
如果做變換
kaldi實現
steps/train_lda_mllt.sh
假設特徵40維,得到的mllt轉換矩陣是40*40,轉換矩陣同時作用於gmm的均值和特徵
參考
1.Semi-tied covariance matrices for hidden Markov models