在語音vad和KWS任務中,經常用到EER,怎麼正確理解EER
FR定義:在一批本該全部正確(TRUE)的列表中出現幾個沒識別出正確的語音,這個就是錯誤拒識FR(False Rejection),是Miss的;
FA定義:在一批本該全部錯誤(Flase)的列表中出現了幾個沒識別出錯誤的語音,就是錯誤的語音被認爲對了,FA(False Acceptance),是Flase Alarm的。
各自佔的比例:FR = Miss / Total_TRUE;FA= False Alarm/ Total_False,這個分別對應DET曲線圖的縱軸和橫軸的截距。可以看下圖:
這個圖裏的RBF核的EER等於7.3%,linear和sigmoid是9.1%左右,poly是13.3%,當我們在圖上找出(7.3,7.3); (9.1,9.1), (13.3,13.3)時,而這些數值其實正好是在各自的曲線上,同時都位於“y=x”的直線上。所以往DET上畫y=x直線,與DET曲線相交的點,就是從DET快速讀出EER的方法。
而當FA=0,本錯的都識別出,部分本對的也拒絕掉,就是FR的截距;當FR=0,本對的都識別出,部分本錯的也接收了,就是FA的截距。
而曲線的點是根據閾值畫出:
當閾值變小時,FR會隨之變小,而FA隨之增大,可以參考DET曲線圖下降趨勢;當到某一點,會存在FR=FA,這時的閾值就是等錯誤率閾值,有EER=FR=FA。同時,拒絕掉的正確樣本佔總正確列表個數=接受了的錯誤樣本佔總錯誤列表個數(把閾值看作爲一條界線劃開)
更多鏈接:https://www.zhihu.com/question/37436914/answer/150485174