語音識別中的詞錯率(SER)以及字錯率(WER)

1.句錯率

句錯率(Sentenct Error Rate,SER):如果識別的句子與標準句子中由任意一個字不對應,那麼這句話就是錯的,錯的句子個數除以總句子個數即爲句錯率。

公式如下:

                        

可以理解爲以下情況:

描述 例子
由於字多而導致句子不對 如:吃了嗎?識別爲:吃了嗎媽?
由於字少而導致句子不對 如:吃了嗎?識別爲:吃嗎?
由於字不對應而導致句子不對 如:吃了嗎?識別爲:吃了嘛?

2.字錯率

字錯率(Word Error Rate,WER):將識別出來的字與標準句子中的字進行比較,統計出需要進行插入(Insertion)、刪除(Deletion)、替換(Substitution)某些字母才能與標準句子中的字一樣的個數,之後除以總字數則爲詞錯率。

公式如下:

                       

可以理解爲以下情況:

描述 例子
Deletion 如:吃了嗎?識別爲:吃了嗎媽?
Insertion 如:吃了嗎?識別爲:吃嗎?

 

Substitution

如:吃了嗎?識別爲:吃了嘛?

3.參考文獻 

[1]Hunt M J . Figures of merit for assessing connected-word recognisers[J]. Speech Communication, 1990, 9(4):329-336.

[2]https://en.wikipedia.org/wiki/Word_error_rate

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章