最近開始學習使用Kaldi,用於語音識別和其他的一些東西,發現網上中文的資料很少,我們公司的聲紋識別特徵提取也從htk遷移到Kaldi上了。我就結合自己學習的經歷寫一個學習手冊吧。
參考:http://www.kaldi-asr.org/doc/tutorial_running.html
下載kaldi:
git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden
編譯安裝:
cd kaldi-trunk/tools/; make; cd ../src; ./configure; make
這樣就安裝完成了(之前在我公司的內網安裝過一次,內網沒有網絡連接,需要離線下載github上的Kaldi源碼和tools中用到的一些依賴包openfst之類,然後修改tools/Makefile 相關地方離線安裝)
-------------------
在寫這篇博客之前我也是對Kaldi幾乎不懂,只是聽說過它的大名,看過它的基於能量的vad判斷部分的code。我們公司其他部門的人用的比較多,從0開始學習,另外明天要參加一個Kaldi線下討論會,算是掃盲,免得去了什麼都聽不懂吧,run幾個sample code,看看它強大的功能吧。