kaldi學習的過程

  最近太忙,羣裏大家討論的不夠積極,而且翻譯的事情似乎大家還在進行中……但是總是有新人進入這個kaldi的學習,在這裏作爲統一的闡述。

  首先,說下kaldi。kaldi是一個語音識別平臺,裏面含有很多語音識別所需要的模型,比如:gmm,sgmm,dnn和hmm。你可以通過自己的數據在這平臺上訓練得到自己的模型,然後用於識別。你需要做的也就是改些腳本,適合自己的語音庫。跟htk這個平臺差不多,只不過kaldi現在含有當前最流行的深度學習模型,這也許是大多數人學習的原因吧。

  其次,kaldi的學習過程。

             第一步,都是安裝過程。大家根據我之前的安裝博客,一般都可以安裝成功,當然可能大家的平臺不同,導致了一些問題,但這些都是可以解決的。平臺大多數是:ubuntu,cygwin等。

             第二步,一般測試下自己是否成功。可以用yesno的數據庫測試下。在egs目錄下的yesno目錄下。

             第三步,你可以用我之前分享的timit數據庫,當然由於版權問題,你只能自己去做實驗,不能發表文章或者其他用途。timit數據集還是比較小的,大約635MB。你可以先跑run.sh,然後再單獨每個步驟的去運行,這樣你就知道自己每步做了些什麼,你就更加的理解。

            第四步,你可以用你自己的數據庫訓練模型和識別。這裏的第一步就是數據準備階段,這個還是有點麻煩,大家可以去kaldi主頁上看這部分的內容,等羣裏@V翻譯出來,大家就可以看中文的了。自己訓練的自己數據庫有些東西還是比較麻煩了,只有自己實踐了纔會清楚。

            此外,kaldi的主頁還有一些其他的功能;比如關鍵詞識別和在線識別等等。大家也可以去嘗試。

  最後,備註下。現在kaldi中有兩個公開的語音庫,你可以去用下,分別是:vystadial_cz和vystadial_en。這個都可以在povey主頁中下到,當然你下載了kaldi,進這些目錄頁可以用程序下載了。這個是數據的問題。此外,還有大家在羣裏問的問題,如果kaldi的問題沒有人回答,可以去http://sourceforge.net/p/kaldi/discussion/這裏問,povey及他的同事們會熱情的回答大家問題。

  最最後,希望大家可以很好的學習kaldi,有問題也歡迎討論。kaldi學習羣:367623211。歡迎您的加入和討論。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章