原创 降噪測試過程中,測試語音選擇的思考

最近一直在測試降噪效果,也花了很多時間,借鑑同事以及資料,自己通過測試比較,有一些感悟,分享出來,希望音頻算法的同行一起討論。 降噪效果測試,正常情況我們會更多注重在噪聲分類上面,往往忽略了語音音素的選擇,這裏我分享下,其實音素在降噪效果

原创 針對rnnoise vad 分享

1、首先,提取特徵點,通過簡單的能量的方式來計算vad,這是很有效的方式,因爲語音源就已經確保都是非常乾淨的語音。從測試的結果來看,準確率也還可以,但是並沒有想象的那麼高,而且很明顯存在滯後以及尾音超前,所以就決定了vad 的效果不會很好

原创 回聲消除aec 效果評測

目前比較通用的評測方法: 1、erle :麥克風信號能量/回聲消除剩餘能量的比值:   ERLE = 10log (E[r(n)^2]/E[(r(n)-r1(n))^2]) dB   r(n) 表示麥克風採集採樣數值。 r1(n) 表示回

原创 降噪效果評測

降噪算法評測一般採用如下方法: 1、TNLR 噪聲總抑制量,越大越好。 2、NPLR 噪聲能量抑制量,越好大越好。 3、SNRI 信噪比提升dB,越大越好。 4、DSN snri與nplr之差,越小越好。 5、pesq 主觀可懂度評分。

原创 深度學習 batch_size epoch 優化

batch_size:可以理解爲批處理參數,它的極限值爲訓練集樣本總數。 epoch  指深度學習過程中,所有數據迭代的次數。 batch_size 太小,算法有可能需要更多epoches 才能收斂。 隨着 batch_size 增大,處

原创 keras loss loss_weight 作用要點總結

1、損失函數 loss的作用 ,損失權重 loss_weight作用: loss 函數:主要有 sse msse 等統計學函數,也可以自定義,作用主要是統計預測值和真實值的距離。 loss_weight:用來計算總的loss 的權重。默認

原创 深度學習降噪 效果分析及挑戰

深度學習降噪,越來越受到音頻算法工程師的關注,以往每一種算法只能處理一種或者幾種效果的侷限有望 被打破,這是大家都往這個方向研究的原因之一。   下面分享基於rnnoise 開源算法的訓練經驗: 1、效果的好壞,第一取決於噪聲源以及純語音

原创 音頻傳輸 rs_fec 和red 的使用比較

webrtc 音頻傳輸出了編解碼有fec外,還會根據丟包率額外帶red包來抵抗丟包。 在硬件信道傳輸中,有一種rs_fec 的編碼來做糾錯。 本文主要對比red 和rs_fec的特點。 red :代碼簡單,計算效率高,接收端恢復時主要看丟

原创 speex aec 與webrtc 回聲消除的比較優化

當前開源回聲消除算法主要有speex 以及webrtc 的aec算法。 兩個開源aec 算法的基本原理都是基於自適應濾波nlms。 兩者的主要區別: speex 使用的是mdf 雙濾波結構。通過前濾波與本次濾波的結果來調整濾波器係數的更新

原创 rnnoise 運行報錯解決

./dump_rnn.py newweights9i.hdf5  rnn_data.c rnn_data.h 運行報錯信息如下: Traceback (most recent call last):   File "./dump_rnn.

原创 rnnoise 48k採樣率 轉16k採樣率有沒有必要?

1、關於rnnoise ,因爲語音增強大部分場景都是16k,所以很多人的就會想要16k 的模型,而作者提供的是48k的模型, 那到底有沒有必要從新訓練成16k 的呢? 優點: a、我們先來分析一下代碼結構,從48k 降低到16k,fft

原创 rnnoise 訓練步驟

git 下載rnnoise 源代碼後,按照下面的步驟運行: (1) cd src ; ./compile.sh (2) ./denoise_training signal.raw noise.raw count > training.f3

原创 rnnoise 降噪特徵點分析

rnnoise  總共提取了42個輸入特徵點: a、針對輸⼊入信號bark 22個頻帶的能量量做dct變換,得到22個BFCC係數。 b、針對22箇中的前六個即1.2k 做導數處理,針對 當前及過去三幀處理理爲(增加12個特徵點): 6個

原创 rnnoise 訓練語料

最近一直研究rnnoise 相關的技術,發現百度大部分的博客都在說作者沒有提供語料,其實就是沒入深入的原因,其實作者是有提供的: 語音資源地址: a、語音: http://www-mmsp.ece.mcgill.ca/Document

原创 rnnoise 降噪算法 與傳統算法對比分析

隨着人工智能的興起,越來越多,傳統語音增強算法的缺點,在深度學習領域得到提高。本文主要針對rnnoise 算法與傳統算法比較分析: 1、傳統降噪算法,大部分是估計噪聲+維納濾波,噪聲估計的準確性,是整個算法效果的核心。 根據噪聲的不同