EER
用的清華數據集訓練(8000HZ,16bit)
測試數據是自己錄製的對應8000HZ,16bit
使用清華數據集自帶的測試集10s註冊,EER在7%左右,20s註冊。EER在4%左右;
自己錄製測試語音的分值幾個都比較接近:
分析可能的原因:
1、8k採樣率低了,羣裏測試語音識別8k的準確率會降低不少,普遍採用16k
2、沒有加入自己的數據進行訓練
3、信道干擾,訓練的數據還是相對“乾淨”許多
4、訓練集不夠
識別太過耗時
提取IVECTOR(ivector 400dim 、gmm 1024dim、11s的語音)居然需要7s才完成,非常慢,具體原因還在分析,還不清楚爲什麼這麼耗時
處理:經過代碼段執行時間檢測,定位到,耗時的主要是IVECTOR提取器加載的過程,要接近4s才能完成
clock_t start = clock();
// g_num_threads affects how ComputeDerivedVars is called when we read the
// extractor.
g_num_threads = sequencer_config.num_threads;
IvectorExtractor extractor;
ReadKaldiObject(ivector_extractor_rxfilename, &extractor);
clock_t ends = clock();
KALDI_LOG << "Running Time : " << (double)(ends - start) / CLOCKS_PER_SEC;
// Running Time : 3.76