深度學習降噪效果分析及挑戰

原創

2019-02-19 06:54

深度學習降噪，越來越受到音頻算法工程師的關注，以往每一種算法只能處理一種或者幾種效果的侷限有望

被打破，這是大家都往這個方向研究的原因之一。

下面分享基於rnnoise 開源算法的訓練經驗：

1、效果的好壞，第一取決於噪聲源以及純語音數據的質量，這是深度學習算法的最重要的部分。所以收集

高質量的數據是關鍵。

2、語音信號特徵點的選擇，也是深度學習算法最重要的部分，直接決定了訓練的效果。

3、深度學習模型結構以及其複雜度，這個現在大部分模型都有一定的效果，哪一個更好就需要自己訓練測試。

總的來說：1 = 2 > 3;

鑑於目前現狀，我覺得對於音頻算法工程師做深度學習降噪的困難主要是：

1、高質量數據的收集，因爲目前網上很難找到好的數據，語音識別的數據往往並不純淨。

2、由於第一點的問題，導致深度學習降噪的效果沒有理想的好，甚至對於一些信噪比的噪聲，效果不如基於

噪聲估計的算法，這個時候就需要採取更多的其他的方式來優化。

3、特徵點的選擇以及訓練模型也需要更多的實驗。

附：

rnnoise 降噪算法與傳統算法對比分析： https://blog.csdn.net/u012514944/article/details/85247753

本文只是簡單分析深度學習降噪目前的挑戰，歡迎大家加音頻算法討論羣：（作者zeark）153268894

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

深度學習抑制嘯叫

以下對比僅來自個人算法，算法不同效果肯定也不一樣，僅供參考一、關於嘯叫，根據聲音系統可以分爲兩種情況來對比傳統和深度學習去嘯叫的效果： 1、一種是擴聲系統，比如大型演播廳，KTV,本地會議擴聲系統等，這種場景下的嘯叫正反饋自激時間短。

2020-06-22 07:16:56

讀論文：Unprocessing Images for Learned Raw Denoising

1 先講講文章幹啥的深度學習降噪需要成對的圖像（噪點數據、對應的清晰數據）。通常 raw 數據經過 isp 流程（我前面的博客介紹過什麼是 isp：圖像 ISP 處理流程以及新人學習圖像的注意點）後得到的 rgb 數據

2020-06-13 22:52:12

噪聲估計之MCRA

MCRA1. 噪聲譜估計（遞歸平均）2. 語音存在概率（最小值控制）2.1. 最小值跟蹤2.2. 語音存在概率計算3.code & result MCRAMCRAMCRA1，全稱爲最小值控制的遞歸平均，是cohen提出的一種常用的

2020-06-13 22:28:35

【rnnoise源碼分析】band能量計算

rnnoise中有個函數compute_band_energy，用於計算band的能量值。這裏有幾個概念需要理清楚。基本概念在看源碼之前，我們要弄懂幾個概念，不然還真沒法看下去了。講一下什麼是frequency band和fr

2020-06-13 10:25:40

C#封裝C++編寫的Speex實現wav音頻降噪(字節數組)

2020-05-23 20:35:18

使用譜減法對語音信號進行降噪(librosa)

2020-05-02 16:42:15

降噪主觀測試，噪聲選擇的思考

2019-04-17 14:18:20

降噪測試過程中，測試語音選擇的思考

2019-04-17 14:18:20

針對rnnoise vad 分享

2019-04-17 14:18:20

降噪效果評測

2019-03-19 14:19:56

rnnoise 48k採樣率轉16k採樣率有沒有必要？

2019-01-26 03:16:58

rnnoise 訓練步驟

2019-01-10 02:52:04

rnnoise 訓練語料

2018-12-26 22:48:29

rnnoise 降噪算法與傳統算法對比分析

2018-12-26 22:48:29

[投稿]一個頻域語音降噪算法實現及改進方法

2018-08-21 01:24:19

24小時熱門文章

最新文章

最新評論文章