Kaldi 底層是使用C++ 編寫的語音識別工具,旨在供語音識別研究員使用。
也是語音識別領域最常用的一個工具。
它自帶了很多特徵提取模塊、語音模型代碼,可直接使用或重新訓練GMM-HMM 等模型。
還支持GPU進行訓練,功能非常強大。很多新手在使用Kaldi時候,都遇到很多問題
網上資料一大堆,有的比較老,很現在的安裝編譯方法不一樣,會各種報錯。
所以把自己安裝編譯kaldi 過程中,遇到的問題以及安裝方法分享給大家。
在安裝過程中,請儘量使用物理機Ubuntu 來進行安裝。虛擬機Ubuntu 會出現不能安裝的問題。
如何安裝:我們直接切入正題:
1、首先,通過我的另外一篇博客,將Ubuntu 的源換成國內的阿里源。
地址:https://blog.csdn.net/u012798683/article/details/100765882
2、按照步驟更換完源後,安裝git
sudo apt-get install git
3、從GitHub上下載kaldi 的源碼
git clone https://github.com/kaldi-asr/kaldi.git
4、安裝kaldi 依賴工具以及所使用的第三方工具庫
sudo apt-get install git
sudo apt-get install bc
sudo apt-get install g++
sudo apt-get install zlib1g-dev make automake autoconf bzip2 libtool subversion
sudo apt-get install libatlas3-base
5、按照上面的安裝完kaldi 的依賴包之後,我們解壓kaldi,運行自帶的腳本文件,來檢測是否安裝完成所需要的依賴。
cd kaldi-master
cd tools
運行依賴檢測腳本:
./extras/check_dependencies.sh
會提示缺失MKL依賴包,也會提示你,到tools目錄下,運行install_mkl.sh腳本文件進行MKL安裝。
運行安裝腳本:
./extras/chech_dependencies.sh
安裝完成以後,再次運行檢查腳本:
./extras/check_dependencies.sh
會提示缺少另外一個依賴包,sox,也同樣會告訴你安裝方式,運行安裝命令即可。
安裝完成後,再次檢測,運行腳本文件。值到沒有提示錯誤,且返回下圖所示內容,依賴既安裝完成。
在tools目錄下面輸入命令:
make -j 4 (意思是多線程加快進度)
或者直接輸入make 也可。然後耐心等待
tools目錄下make 完成後,說明我們的外部依賴和第三方庫已經全部安裝完成。
下面進入到src目錄下,進行編譯安裝。
cd ..
cd src
進入src 按照指令進行安裝:
./configure --shared
make depend
make
執行完上述命令,接下來就是耐心等待make的完成
這裏進行make 的時候花的時間比較久,耐心等待即可,
make 完成後,會提示如下圖
提示echo Done
Done
即表示make完成,
下面我們可以跑一個簡單的例子,來驗證,kaldi是否安裝成功。
我們進入到路徑,kaldi-master/egs/yesno/s5,目錄下
運行下面的命令:
./run.sh
運行完成後,如果沒有報錯,那說明你已經安裝成功。
運行完 yesno 例子以後,顯示如下,說明已經安裝成功。
kaldi 就算安裝完成。