基於HTK的連續語音識別系統搭建學習筆記(三)

[step 8]重校準訓練數據

確認trainwords.mlf中的路徑爲"*/S0???.lab",修改dict2加入silence sil一項,另存爲dict3。

執行:

HVite -l * -o SWT -b silence -C .\config\config1 -a -H .\hmms\hmm7\macros -H .\hmms\hmm7\hmmdefs -i .\labels\aligned.mlf -m -t 350.0 -y lab -I .\labels\trainwords.mlf -S train.scp .\dict\dict3 .\lists\monophones1

生成文件:aligned.mlf(加入了sil)

生成位置:labels

注:HVite工具的詳細介紹和使用參看HTK BOOK P316

重估兩次:

HERest -C .\config\config1 -I .\labels\aligned.mlf -t 250.0 150.0 1000.0 -S train.scp -H .\hmms\hmm7\macros -H .\hmms\hmm7\hmmdefs -M .\hmms\hmm8 .\lists\monophones1 

HERest -C .\config\config1 -I .\labels\aligned.mlf -t 250.0 150.0 1000.0 -S train.scp -H .\hmms\hmm8\macros -H .\hmms\hmm8\hmmdefs -M .\hmms\hmm9 .\lists\monophones1

我們再來看看這時的識別率怎麼樣:

HVite -H .\hmms\hmm9\macros -H .\hmms\hmm9\hmmdefs -S test.scp -l * -i .\results\recout_step8.mlf -w wdnet -p 0.0 -s 5.0 .\dict\dict2 .\lists\monophones1 

HResults -I .\labels\testwords.mlf .\lists\monophones1 .\results\recout_step8.mlf


可以看出,識別結果比校準前有不小的提高。我們繼續重估兩次測試一下結果,看看會出現什麼情況:

HERest -C .\config\config1 -I .\labels\aligned.mlf -t 250.0 150.0 1000.0 -S train.scp -H .\hmms\hmm9\macros -H .\hmms\hmm9\hmmdefs -M .\hmms\hmm9_1 .\lists\monophones1 
 
HERest -C .\config\config1 -I .\labels\aligned.mlf -t 250.0 150.0 1000.0 -S train.scp -H .\hmms\hmm9_1\macros -H .\hmms\hmm9_1\hmmdefs -M .\hmms\hmm9_2 .\lists\monophones1 
 
HVite -H .\hmms\hmm9\macros -H .\hmms\hmm9\hmmdefs -S test.scp -l * -i .\results\recout_step8_2.mlf -w wdnet -p 0.0 -s 5.0 .\dict\dict2 .\lists\monophones1 
 
HResults -I .\labels\testwords.mlf .\lists\monophones1 .\results\recout_step8_2.mlf 

識別效果:


發現識別結果不再提高!下面通過綁定狀態的三音素模型來進一步提高識別效果
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章