聲紋測試結果分析

EER

用的清華數據集訓練(8000HZ,16bit)

測試數據是自己錄製的對應8000HZ,16bit

使用清華數據集自帶的測試集10s註冊,EER在7%左右,20s註冊。EER在4%左右;

自己錄製測試語音的分值幾個都比較接近:

分析可能的原因:

1、8k採樣率低了,羣裏測試語音識別8k的準確率會降低不少,普遍採用16k

2、沒有加入自己的數據進行訓練

3、信道干擾,訓練的數據還是相對“乾淨”許多

4、訓練集不夠


識別太過耗時

提取IVECTOR(ivector 400dim 、gmm 1024dim、11s的語音)居然需要7s才完成,非常慢,具體原因還在分析,還不清楚爲什麼這麼耗時

處理:經過代碼段執行時間檢測,定位到,耗時的主要是IVECTOR提取器加載的過程,要接近4s才能完成

clock_t start = clock();

// g_num_threads affects how ComputeDerivedVars is called when we read the
// extractor.
g_num_threads = sequencer_config.num_threads;
IvectorExtractor extractor;
ReadKaldiObject(ivector_extractor_rxfilename, &extractor);

clock_t ends = clock();
KALDI_LOG << "Running Time : " << (double)(ends - start) / CLOCKS_PER_SEC;
// Running Time : 3.76


發佈了55 篇原創文章 · 獲贊 18 · 訪問量 8萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章