台部落zeark

原创降噪測試過程中，測試語音選擇的思考

最近一直在測試降噪效果，也花了很多時間，借鑑同事以及資料，自己通過測試比較，有一些感悟，分享出來，希望音頻算法的同行一起討論。降噪效果測試，正常情況我們會更多注重在噪聲分類上面，往往忽略了語音音素的選擇，這裏我分享下，其實音素在降噪效果

2019-04-17 14:18:20

原创針對rnnoise vad 分享

1、首先，提取特徵點，通過簡單的能量的方式來計算vad，這是很有效的方式，因爲語音源就已經確保都是非常乾淨的語音。從測試的結果來看，準確率也還可以，但是並沒有想象的那麼高，而且很明顯存在滯後以及尾音超前，所以就決定了vad 的效果不會很好

2019-04-17 14:18:20

原创回聲消除aec 效果評測

目前比較通用的評測方法： 1、erle :麥克風信號能量/回聲消除剩餘能量的比值： ERLE = 10log (E[r(n)^2]/E[(r(n)-r1(n))^2]) dB r(n) 表示麥克風採集採樣數值。 r1(n) 表示回

2019-03-19 14:20:07

原创降噪效果評測

降噪算法評測一般採用如下方法： 1、TNLR 噪聲總抑制量，越大越好。 2、NPLR 噪聲能量抑制量，越好大越好。 3、SNRI 信噪比提升dB，越大越好。 4、DSN snri與nplr之差，越小越好。 5、pesq 主觀可懂度評分。

2019-03-19 14:19:56

原创深度學習 batch_size epoch 優化

batch_size:可以理解爲批處理參數，它的極限值爲訓練集樣本總數。 epoch 指深度學習過程中，所有數據迭代的次數。 batch_size 太小，算法有可能需要更多epoches 才能收斂。隨着 batch_size 增大，處

2019-03-18 14:20:11

原创 keras loss loss_weight 作用要點總結

1、損失函數 loss的作用，損失權重 loss_weight作用： loss 函數：主要有 sse msse 等統計學函數，也可以自定義，作用主要是統計預測值和真實值的距離。 loss_weight:用來計算總的loss 的權重。默認

2019-03-01 02:55:56

原创深度學習降噪效果分析及挑戰

深度學習降噪，越來越受到音頻算法工程師的關注，以往每一種算法只能處理一種或者幾種效果的侷限有望被打破，這是大家都往這個方向研究的原因之一。下面分享基於rnnoise 開源算法的訓練經驗： 1、效果的好壞，第一取決於噪聲源以及純語音

2019-02-19 06:54:45

原创音頻傳輸 rs_fec 和red 的使用比較

webrtc 音頻傳輸出了編解碼有fec外，還會根據丟包率額外帶red包來抵抗丟包。在硬件信道傳輸中，有一種rs_fec 的編碼來做糾錯。本文主要對比red 和rs_fec的特點。 red ：代碼簡單，計算效率高，接收端恢復時主要看丟

2019-02-14 12:56:12

原创 speex aec 與webrtc 回聲消除的比較優化

當前開源回聲消除算法主要有speex 以及webrtc 的aec算法。兩個開源aec 算法的基本原理都是基於自適應濾波nlms。兩者的主要區別: speex 使用的是mdf 雙濾波結構。通過前濾波與本次濾波的結果來調整濾波器係數的更新

2019-02-14 12:56:12

288

原创 rnnoise 運行報錯解決

./dump_rnn.py newweights9i.hdf5 rnn_data.c rnn_data.h 運行報錯信息如下： Traceback (most recent call last): File "./dump_rnn.

2019-01-26 03:16:58

原创 rnnoise 48k採樣率轉16k採樣率有沒有必要？

1、關於rnnoise ，因爲語音增強大部分場景都是16k，所以很多人的就會想要16k 的模型，而作者提供的是48k的模型，那到底有沒有必要從新訓練成16k 的呢？優點： a、我們先來分析一下代碼結構，從48k 降低到16k，fft

2019-01-26 03:16:58

原创 rnnoise 訓練步驟

git 下載rnnoise 源代碼後，按照下面的步驟運行： (1) cd src ; ./compile.sh (2) ./denoise_training signal.raw noise.raw count > training.f3

2019-01-10 02:52:04

100