聲學特徵變換 STC/MLLT


背景

Global Semi-tied Covariance (STC)/Maximum Likelihood Linear Transform (MLLT) estimation
gmm建模方差使用對角矩陣的前提是假設特徵之間相互獨立,使用full或者block-diagonal矩陣可以對相關性的特徵建模,但是參數增多。爲了解決使用這個問題,有兩種方法:
- feature-space 使用DCT或者LDA去相關
- model-space 不同的模型可以使用不同的轉換,更靈活

semi-tied covariance matrices是model-space裏面的一種形式,也是爲了解決使用full covariance的參數量大的問題。相比於full covariance,這種方法的每個高斯分量有兩個方差矩陣:
1. diagonal covariance(m)diag
2. semi-tied class-dependent nondiagonal matrix H(r) ,可以在多個高斯分量之間共享(比如所有monophone對用狀態的高斯分量)。

最後的方差矩陣:(m)=H(r)(m)diagH(r)T ,使用最大似然估計結合EM算法求解對應的參數。
如果做變換A(r)=H(r)1 ,把在分母上的semi-tied covariance轉換到分子上面,也就是相當於特徵o(τ) 和均值μ(m) 同時乘以A(r) ,也就是對特徵和gmm的均值同時做MLLT。

kaldi實現

steps/train_lda_mllt.sh
假設特徵40維,得到的mllt轉換矩陣是40*40,轉換矩陣同時作用於gmm的均值和特徵

參考

1.Semi-tied covariance matrices for hidden Markov models

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章