基本上沒有寫博客的習慣,之前都是自己在Evernote上記筆記。看了很多牛人的博客,對自己的幫助很大,同時自己也經常忘記一些知識,因此在csdn上嘗試記下筆記,希望能夠幫助到其他人,也提醒自己一些過往的知識和內容。
HTK是語音識別的一個開源工具,能夠幫助大家進行ASR的入門。關於安裝已經有很多博客都已經寫了,因此這裏寫一點其它的內容。
之前有同學對測試結果HResults的輸出文本有些不理解。這裏簡單解釋一下幾個縮寫名詞。
詞是分爲正確率和準確率的。
正確率:只要和原來的標籤相同就算正確。
準確率:除了要正確,還需要加上因爲插入其它詞造成的錯誤。
Percent Correct = ( N − D − S )× 100%/ N
Percent Accuracy = ( N−
D−
S− I )× 100%
/ N
N- total number of labels (總標籤數)
D- deletion errors (刪除錯誤)
S-
substitution errors (替換錯誤)
I-
insertion errors (插入錯誤)