kaldi源碼分析(一)-scripts level

kaldi安裝

sudo apt-get update
sudo apt-get upgrade
sudo apt-get install git
sudo apt-get install -y git wget libatlas-dev libatlas-base-dev gfortran g++ zlib1g-dev autoconf automake gcc libtool perl subversion
git clone https://github.com/kaldi-asr/kaldi.git
cd kaldi/tools make cd kaldi/src .
/configure --shared
make clean make
depend make


安裝語言模型訓練工具

cd extras/
./install_irstlm.sh

在之前進行安裝kaldi時,kaldi數學計算庫默認爲 英特爾MKL庫,當進行配置./configure時失敗時,往往是由於系統中未安裝MKL數學計算庫,可以嘗試通過以下命令進行配置 ATLAS 數學計算庫

./configure --shared --mathlib=ATLAS --atlas-root=../tools/ATLAS_headers/ 

數據準備

訓練數據準備

在進行特徵提取之前需要對文本進行處理,生成聲學模型訓練的數據準備文件
utt2spk text wav.scp

utt2spk : uttid spkid
text : uttid 標註
wav.scp :uttid wav路徑


生成發音詞典 L.fst

將之前的詞典轉換爲L.fst 以及 topo文件

utils/prepare_lang.sh --position-dependent-phones false lang/dict “<UNK>” lang/local lang/lang


聲學模型訓練

腳本 作用
steps/train_mono.sh 單音素訓練
steps/train_deltas.sh 以單音素模型爲輸入訓練上下文相關的三音素模型
steps/nnets nnet3神經網絡

語言模型訓練

解碼

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章