本翻譯僅供自己學習使用,不承擔任何其他責任。水平有限拒絕轉載。歡迎大家指出錯誤,共同學習。
我們假設本頁的讀者瞭解使用HMM-GMM進行語音識別的基礎知識。在這裏我們需要在線簡明介紹的是:M. Gales and S. Young (2007).``The Application of Hidden Markov Models in Speech Recognition." Foundations and Trends in Signal Processing 1(3): 195-304. HTK教程也是一個非常好的資源。然而,除非你擁有很棒的數學底子而且非常專注於它,我們並不建議學習者衝破經典(outside an institutional setting.)進行語音識別學習。本頁讀者同時也是語音識別研究者,也可能是這個領域的畢業生或者進階者。
我們假定你知道C++,至少熟悉一些shell腳本,最好使用bash或者相近的shell。本教程假定你正在使用UNIX相關環境或者Cygwin(雖然Kaldi不必完全匹配或者運行在所有的這些環境中)。
本系統的必要條件很簡單。我們假定你擁有以下工具包(tools)包括wget, git, svn, awk, perl等等,或者你瞭解如何去安裝它們。安裝過程中最困難的部分主要跟math library ATLAS相關。如果你係統當中沒有安裝這個庫,你需要去編輯它而且這過程中CPU throttling需要被關閉,這需要root權限。我們提供所有安裝步驟的腳本和細節介紹。當腳本運行失敗,請仔細閱讀運行結果,可以爲如何解決這個問題提供思路。如果在任何步驟有問題請聯繫我們,無論這個問題多麼小,請參照 Other Kaldi-related resources (and how to get help)。
我們提供了一些關於本教程中每一步執行需要多久之類的信息。如果你只有很有限的時間去完成這個教程,一定要跳過以下步驟及不想鏈接到我們在文本中提供的那麼多信息的話,我們還是建議你儘量遵守已經公佈的時間表。這將會確保你能得到一個比較好的全局概覽。你在之後的學習中需要複習更多數學中的細節。如果本教程用於教學,請把整個教程在相應環境下運行一遍,以此確保所有的先行條件都被安裝。
---------------------------------------------------------------------------------------------------------
kaldi主頁:http://kaldi-asr.org/doc/index.html
---------------------------------------------------------------------------------------------------------