HTK語音識別HResults的結果解釋

基本上沒有寫博客的習慣,之前都是自己在Evernote上記筆記。看了很多牛人的博客,對自己的幫助很大,同時自己也經常忘記一些知識,因此在csdn上嘗試記下筆記,希望能夠幫助到其他人,也提醒自己一些過往的知識和內容。


HTK是語音識別的一個開源工具,能夠幫助大家進行ASR的入門。關於安裝已經有很多博客都已經寫了,因此這裏寫一點其它的內容。

之前有同學對測試結果HResults的輸出文本有些不理解。這裏簡單解釋一下幾個縮寫名詞。


詞是分爲正確率和準確率的。

正確率:只要和原來的標籤相同就算正確。

準確率:除了要正確,還需要加上因爲插入其它詞造成的錯誤。

Percent Correct = ( N − D − S )× 100%N
Percent Accuracy = ( N D S− I  )× 100% / N
N- total number of labels (總標籤數)
D- deletion errors (刪除錯誤)
S-  substitution errors (替換錯誤)
I-  insertion errors (插入錯誤)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章