羣裏的@卡丁王一直想用kaldi提自己想要的特徵,但是他老是出現錯誤。我自己試驗下,下面是具體流程,希望你有所收穫。
首先,確保你的s5文件夾有conf local step utils文件夾。然後你把你的數據保存爲test文件夾,比如test文件夾裏有test1.wav test2.wav test3.wav。
然後,新建個data文件夾,data文件夾新建個test文件夾,這個test文件夾裏需要三個文件:wav.scp utt2spk spk2utt。
Wav.scp可以這麼寫:
test1 test/test1.wav
test2 test/test2.wav
test3 test/test3.wav
Utt2spk可以這麼寫:
test1 global
test2 global
test3 global
Spk2utt可以這麼寫:
global test1 test2 test3
至此,都準備好了。
然後改下腳本。Run1.sh的內容爲:
#!/bin/bash
train_cmd="utils/run.pl"
decode_cmd="utils/run.pl"
# Feature extraction
for x in test ; do
steps/make_mfcc.sh --nj 1 data/$x exp/make_mfcc/$x mfcc
done
最後運行腳本run1.sh即可。
最後你就得到你想要的特徵了。怎麼樣,簡單吧。let us continue……
此外,kaldi裏的mfcc如何與htk裏的mfcc轉換?
在kaldi中,kaldi支持了copy-feats-to-htk來把kaldi裏的mfcc轉換爲htk的mfcc。
至於,htk怎麼轉換爲kaldi的?等待其他人公開吧。