kaldi安裝
sudo apt-get update
sudo apt-get upgrade
sudo apt-get install git
sudo apt-get install -y git wget libatlas-dev libatlas-base-dev gfortran g++ zlib1g-dev autoconf automake gcc libtool perl subversion
git clone https://github.com/kaldi-asr/kaldi.git
cd kaldi/tools make cd kaldi/src .
/configure --shared
make clean make
depend make
安裝語言模型訓練工具
cd extras/
./install_irstlm.sh
在之前進行安裝kaldi時,kaldi數學計算庫默認爲 英特爾MKL庫,當進行配置./configure時失敗時,往往是由於系統中未安裝MKL數學計算庫,可以嘗試通過以下命令進行配置 ATLAS 數學計算庫
./configure --shared --mathlib=ATLAS --atlas-root=../tools/ATLAS_headers/
數據準備
訓練數據準備
在進行特徵提取之前需要對文本進行處理,生成聲學模型訓練的數據準備文件
utt2spk text wav.scp
utt2spk : uttid spkid
text : uttid 標註
wav.scp :uttid wav路徑
生成發音詞典 L.fst
將之前的詞典轉換爲L.fst 以及 topo文件
utils/prepare_lang.sh --position-dependent-phones false lang/dict “<UNK>” lang/local lang/lang
聲學模型訓練
腳本 | 作用 |
---|---|
steps/train_mono.sh | 單音素訓練 |
steps/train_deltas.sh | 以單音素模型爲輸入訓練上下文相關的三音素模型 |
steps/nnets | nnet3神經網絡 |