声纹测试结果分析

EER

用的清华数据集训练(8000HZ,16bit)

测试数据是自己录制的对应8000HZ,16bit

使用清华数据集自带的测试集10s注册,EER在7%左右,20s注册。EER在4%左右;

自己录制测试语音的分值几个都比较接近:

分析可能的原因:

1、8k采样率低了,群里测试语音识别8k的准确率会降低不少,普遍采用16k

2、没有加入自己的数据进行训练

3、信道干扰,训练的数据还是相对“干净”许多

4、训练集不够


识别太过耗时

提取IVECTOR(ivector 400dim 、gmm 1024dim、11s的语音)居然需要7s才完成,非常慢,具体原因还在分析,还不清楚为什么这么耗时

处理:经过代码段执行时间检测,定位到,耗时的主要是IVECTOR提取器加载的过程,要接近4s才能完成

clock_t start = clock();

// g_num_threads affects how ComputeDerivedVars is called when we read the
// extractor.
g_num_threads = sequencer_config.num_threads;
IvectorExtractor extractor;
ReadKaldiObject(ivector_extractor_rxfilename, &extractor);

clock_t ends = clock();
KALDI_LOG << "Running Time : " << (double)(ends - start) / CLOCKS_PER_SEC;
// Running Time : 3.76


发布了55 篇原创文章 · 获赞 18 · 访问量 8万+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章