kaldi學習的過程

原創

2020-06-21 16:52

最近太忙，羣裏大家討論的不夠積極，而且翻譯的事情似乎大家還在進行中……但是總是有新人進入這個kaldi的學習，在這裏作爲統一的闡述。

首先，說下kaldi。kaldi是一個語音識別平臺，裏面含有很多語音識別所需要的模型，比如：gmm，sgmm，dnn和hmm。你可以通過自己的數據在這平臺上訓練得到自己的模型，然後用於識別。你需要做的也就是改些腳本，適合自己的語音庫。跟htk這個平臺差不多，只不過kaldi現在含有當前最流行的深度學習模型，這也許是大多數人學習的原因吧。

其次，kaldi的學習過程。

第一步，都是安裝過程。大家根據我之前的安裝博客，一般都可以安裝成功，當然可能大家的平臺不同，導致了一些問題，但這些都是可以解決的。平臺大多數是：ubuntu，cygwin等。

第二步，一般測試下自己是否成功。可以用yesno的數據庫測試下。在egs目錄下的yesno目錄下。

第三步，你可以用我之前分享的timit數據庫，當然由於版權問題，你只能自己去做實驗，不能發表文章或者其他用途。timit數據集還是比較小的，大約635MB。你可以先跑run.sh，然後再單獨每個步驟的去運行，這樣你就知道自己每步做了些什麼，你就更加的理解。

第四步，你可以用你自己的數據庫訓練模型和識別。這裏的第一步就是數據準備階段，這個還是有點麻煩，大家可以去kaldi主頁上看這部分的內容，等羣裏@V翻譯出來，大家就可以看中文的了。自己訓練的自己數據庫有些東西還是比較麻煩了，只有自己實踐了纔會清楚。

此外，kaldi的主頁還有一些其他的功能;比如關鍵詞識別和在線識別等等。大家也可以去嘗試。

最後，備註下。現在kaldi中有兩個公開的語音庫，你可以去用下，分別是：vystadial_cz和vystadial_en。這個都可以在povey主頁中下到，當然你下載了kaldi，進這些目錄頁可以用程序下載了。這個是數據的問題。此外，還有大家在羣裏問的問題，如果kaldi的問題沒有人回答，可以去http://sourceforge.net/p/kaldi/discussion/這裏問，povey及他的同事們會熱情的回答大家問題。

最最後，希望大家可以很好的學習kaldi，有問題也歡迎討論。kaldi學習羣：367623211。歡迎您的加入和討論。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

kaldi學習的過程

kaldi中的數據準備

kaldi學習的過程

我們的語音識別有論壇了……

如何利用kaldi提自己想要的特徵（mfcc plp pitch）

kaldi主頁上的翻譯的事情（更新)

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結