原创 說話人識別開集open-set和閉集close-set的區別

先引用知乎上 @LEON晉 大神解釋的說話人識別對說話人準確率判斷的兩個評分標準:在一批本該全部正確(TRUE)的列表中出現幾個沒識別出正確的語音,這個就是錯誤拒識FR(False Rejection),是Miss的;在一批本該全部錯誤(

原创 WAV文件數據解析(4.10更新一點小代碼)

作爲一個初級的算法和聲紋的工程師,寫個blog記錄一下自己近期所接觸的知識點,作爲日後參考和複習用首先都是文本,後期有空再加圖片和改格式,很多內容都是通過被人的blog參考和整理得來。日後慢慢的更新聲紋識別SRE的算法以及機器學習的算法和

原创 GPLDA的LN和各種GPLDA很皮的玩法(有疑問請提出)

gplda也就是我們常說的plda,即假設設本徵音和本徵信道滿足高斯分佈而得名. ht-plda:重尾分佈的PLDA, 重尾分佈是指少量個體作出大量貢獻,佔大量的資源,假設的是student t 分佈 在一些論文中可以看到,ivector