Kaldi學習筆記(一)——Kaldi的下載安裝與編譯

Kaldi是一款基於C++編寫的開源語音識別工具箱。這款工具既可以在Windows下編譯也可以在Linux下編譯。本次我是在虛擬機裝上了Ubuntu 16.04.03,64位,可以聯網。文檔裏面也說還是建議在Linux下使用Kaldi。

原文地址:https://blog.csdn.net/snowdroptulip/article/details/78896915

一、下載

下載直接利用git版本控制系統就可以了,打開終端,直接在你的實驗目錄下輸入命令:

git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden

不一會就從github上下載下來了。當然,首先得確保你安裝了git。要是沒安裝的話,就先輸入:

sudo apt-get install git

安裝git版本控制軟件。

二、各目錄功能

下載完畢以後,cd kaldi-trunk進去看看下載了一些什麼東西。 

其中,./tools,./src和./egs這三個目錄是比較重要的。

./tools目錄下面全部都是Kaldi依賴的包。其中主要有:

OpenFST:Weighted Finite State Transducer library,是一個用來構造有限狀態自動機的庫。我們知道隱馬爾科夫模型就可以看成是一個有限狀態自動機的。這是最終要的一個包,Kaldi的文檔裏面說:If you ever want to understand Kaldi deeply you will need to understand OpenFst.
ATLAS:這是一個C++下的線性代數庫。做機器學習自然是需要很多矩陣運算的。
IRSTLM:這是一個統計語言模型的工具包。
sph2pipe:這是賓夕法尼亞大學linguistic data consortium(LDC)開發的一款處理SPHERE_formatted數字音頻文件的軟件,它可以將LDC的sph格式的文件轉換成其它格式。
./src目錄存放的是Kaldi的源代碼。

./egs存放的是Kaldi提供的一些例子。我們現在要做的就是編譯安裝Kaldi依賴的各種庫,然後編譯安裝Kaldi。

三、Kaldi的編譯

安裝之前需要確保你安裝了這些軟件:

apt-get 
subversion 
automake 
autoconf 
libtool 
g++ 
zlib 
libatal 
wget

安裝方法爲在shell裏輸入:

sudo apt-get install subversion
sudo apt-get install automake
sudo apt-get install autoconf
sudo apt-get install libtool
sudo apt-get install g++
sudo apt-get install wget
sudo apt-get install libatlas-dev
sudo apt-get install libatlas-base-dev
sudo apt-get install zlib1g
sudo apt-get install zlib1g-dev 

1.在./tool目錄下輸入make,開始編譯,輸入make -j 4命令可以加快速度(多核並行處理)。 
2.之後切換到./src目錄下,輸入./configure進行配置,然後輸入make all進行編譯。當然這個過程也可以並行處理加速,輸入make -j 4。經過漫長的編譯過程以後,就安裝完畢了。
--------------------- 
作者:snowdroptulip 
來源:CSDN 
原文:https://blog.csdn.net/snowdroptulip/article/details/78896915 
版權聲明:本文爲博主原創文章,轉載請附上博文鏈接!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章