HTK語音識別HResults的結果解釋

原創

2018-09-02 08:25

基本上沒有寫博客的習慣，之前都是自己在Evernote上記筆記。看了很多牛人的博客，對自己的幫助很大，同時自己也經常忘記一些知識，因此在csdn上嘗試記下筆記，希望能夠幫助到其他人，也提醒自己一些過往的知識和內容。

HTK是語音識別的一個開源工具，能夠幫助大家進行ASR的入門。關於安裝已經有很多博客都已經寫了，因此這裏寫一點其它的內容。

之前有同學對測試結果HResults的輸出文本有些不理解。這裏簡單解釋一下幾個縮寫名詞。

詞是分爲正確率和準確率的。

正確率：只要和原來的標籤相同就算正確。

準確率：除了要正確，還需要加上因爲插入其它詞造成的錯誤。

Percent Correct = ( N − D − S )× 100%/ N

Percent Accuracy = ( N− D− S− I )× 100% / N

N- total number of labels （總標籤數）

D- deletion errors （刪除錯誤）

S- substitution errors （替換錯誤）

I- insertion errors （插入錯誤）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.