1.句錯率
句錯率(Sentenct Error Rate,SER):如果識別的句子與標準句子中由任意一個字不對應,那麼這句話就是錯的,錯的句子個數除以總句子個數即爲句錯率。
公式如下:
可以理解爲以下情況:
描述 | 例子 |
由於字多而導致句子不對 | 如:吃了嗎?識別爲:吃了嗎媽? |
由於字少而導致句子不對 | 如:吃了嗎?識別爲:吃嗎? |
由於字不對應而導致句子不對 | 如:吃了嗎?識別爲:吃了嘛? |
2.字錯率
字錯率(Word Error Rate,WER):將識別出來的字與標準句子中的字進行比較,統計出需要進行插入(Insertion)、刪除(Deletion)、替換(Substitution)某些字母才能與標準句子中的字一樣的個數,之後除以總字數則爲詞錯率。
公式如下:
可以理解爲以下情況:
描述 | 例子 |
Deletion | 如:吃了嗎?識別爲:吃了嗎媽? |
Insertion | 如:吃了嗎?識別爲:吃嗎? |
Substitution |
如:吃了嗎?識別爲:吃了嘛? |
3.參考文獻
[1]Hunt M J . Figures of merit for assessing connected-word recognisers[J]. Speech Communication, 1990, 9(4):329-336.