聲紋測試結果分析

原創

wuxianfeng1987

2020-02-21 08:58

EER

用的清華數據集訓練（8000HZ，16bit）

測試數據是自己錄製的對應8000HZ，16bit

使用清華數據集自帶的測試集10s註冊，EER在7%左右，20s註冊。EER在4%左右；

自己錄製測試語音的分值幾個都比較接近：

分析可能的原因：

1、8k採樣率低了，羣裏測試語音識別8k的準確率會降低不少，普遍採用16k

2、沒有加入自己的數據進行訓練

3、信道干擾，訓練的數據還是相對“乾淨”許多

4、訓練集不夠

識別太過耗時

提取IVECTOR（ivector 400dim 、gmm 1024dim、11s的語音）居然需要7s才完成，非常慢，具體原因還在分析，還不清楚爲什麼這麼耗時

處理：經過代碼段執行時間檢測，定位到，耗時的主要是IVECTOR提取器加載的過程，要接近4s才能完成

clock_t start = clock();

// g_num_threads affects how ComputeDerivedVars is called when we read the
// extractor.
g_num_threads = sequencer_config.num_threads;
IvectorExtractor extractor;
ReadKaldiObject(ivector_extractor_rxfilename, &extractor);

clock_t ends = clock();
KALDI_LOG << "Running Time : " << (double)(ends - start) / CLOCKS_PER_SEC;
// Running Time : 3.76

wuxianfeng1987

發佈了55 篇原創文章 · 獲贊 18 · 訪問量 8萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

聲紋測試結果分析

AI模型 Llama 3體驗筆記

【面試準備】又一次失敗的面試經歷，題目離譜～資深軟件測試工程師

dotnet 8 版本與銀河麒麟V10和UOS系統的 glibc 兼容性

kaldi安裝編譯

Timit SPHERE格式轉換

linux 使用記錄

儀表識別實時儀表盤識別

python django 使用記錄

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結