此文記錄我在使用HTK時出現的問題以及解決思想
在訓練wrd格式文件的時候,出現下列錯誤
一、Editing file: ..\data\trainp\
ERROR [+6510] LOpen: Unable to open label file ..\data\trainp\FATAL ERROR - Terminating program HLEd
經檢查發現時lists文件下的trainp文件中的列表多了一個”..\data\trainp\ “ 路徑導致的!
二、 之前的訓練phn級訓練,現改爲word級訓練,在修改了list的文件後運行程序發現依然程序在搜尋 “trnpList”文件,此文件爲PHN級標註文件
初步估計是在HTKTOOL中的設置沒有更改,正在想辦法解決
Reference to non-existent field 'trnpList'.
Error in HTKtool2 (line 123)
[rt, msg] = HLEd(CPS.trnpList, CPS.srcFmt, CPS.trnMlf, CPS.hmmList, CPS.edFile);
出現上面的問題,主要是HTK的參數只能識別phone級的,不能識別word級別的,我現在的解決辦法是:求出每條語音的長度,取平均數,每個單詞對應一個時間,類似下圖
三、 - system is PLAIN
ERROR [+2121] HInit: Too Few Observation Sequences [1]
FATAL ERROR - Terminating program HInit
出現上面問題,可能是自己的訓練語句不足,需要更改state and mixure,這兩個參數是GMM裏面的。
這個問題最終發現是因爲lab文件中沒有靜音標識“#h”
OPENSLR數據和TIMIT數據的區別就在於,OPENSLR數據沒有時間標註,只需要往TIMIT數據的標註更改,最終還是可以跑通的