声纹测试结果分析

原創

wuxianfeng1987

2020-02-21 08:58

EER

用的清华数据集训练（8000HZ，16bit）

测试数据是自己录制的对应8000HZ，16bit

使用清华数据集自带的测试集10s注册，EER在7%左右，20s注册。EER在4%左右；

自己录制测试语音的分值几个都比较接近：

分析可能的原因：

1、8k采样率低了，群里测试语音识别8k的准确率会降低不少，普遍采用16k

2、没有加入自己的数据进行训练

3、信道干扰，训练的数据还是相对“干净”许多

4、训练集不够

识别太过耗时

提取IVECTOR（ivector 400dim 、gmm 1024dim、11s的语音）居然需要7s才完成，非常慢，具体原因还在分析，还不清楚为什么这么耗时

处理：经过代码段执行时间检测，定位到，耗时的主要是IVECTOR提取器加载的过程，要接近4s才能完成

clock_t start = clock();

// g_num_threads affects how ComputeDerivedVars is called when we read the
// extractor.
g_num_threads = sequencer_config.num_threads;
IvectorExtractor extractor;
ReadKaldiObject(ivector_extractor_rxfilename, &extractor);

clock_t ends = clock();
KALDI_LOG << "Running Time : " << (double)(ends - start) / CLOCKS_PER_SEC;
// Running Time : 3.76

wuxianfeng1987

发布了55 篇原创文章 · 获赞 18 · 访问量 8万+

私信关注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

声纹测试结果分析

诈骗（杀猪盘）网站进行渗透测试

Python 潮流周刊#50：我最喜欢的 Python 3.13 新特性！

【Python】保存gym截图

【译】使用 GitHub Copilot 作为你的编码 GPS

Linux 服务器配置-安装portainer-ce社区版

外行也能读懂的网络硬件设备功能原理速成

kaldi安裝編譯

Timit SPHERE格式轉換

linux 使用記錄

儀表識別實時儀表盤識別

python django 使用記錄

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結