關於模型的訓練這裏就不寫了,網上搜thchs30資料有很多,關鍵說一下如果使用訓練好的模型
大體的過程參考這裏:https://www.2cto.com/kf/201706/651060.html
上面的步驟基本是正確的,但是有一個關鍵點有問題,就是run.sh文件的修改上,對於live所對應的命令,修改方式應該爲:
online-wav-gmm-decode-faster --rt-min=0.3 --rt-max=0.5 --max-active= 4000 --beam=12.0 --acoustic-scale=0.0769 scp:$decode_dir/input.scp $ac_model /final.mdl $ac_model/HCLG.fst $ac_model/words.txt '1:2:3:4:5' ark,t:work/tra ns.txt ark,t:work/ali.txt;;
online-gmm-decode-faster:識別從麥克風輸入的語音
online-wav-gmm-decode-faster:識別指定的wav文件(通常我們都是遠程使用虛機,所以使用這個)