針對rnnoise vad 分享

原創

2019-04-17 14:18

1、首先，提取特徵點，通過簡單的能量的方式來計算vad，這是很有效的方式，因爲語音源就已經確保都是非常乾淨的語音。從測試的結果來看，準確率也還可以，但是並沒有想象的那麼高，而且很明顯存在滯後以及尾音超前，所以就決定了vad 的效果不會很好。

2、在訓練模型時，正因爲vad 的效果不會太好，所以設計的訓練單元也就不是很多，對於vad 的輸出，特別是低信噪比的輸出結果就很不理想，在訓練過程，針對vad 的權重也設置的非常的低，這是非常合理的。

3、通過修改vad 以及權重，對整個訓練的影響非常的大，比如修改提取特徵點時,計算vad 的方法，使得vad 更準確，訓練後效果失真更小，但是通過訓練過程的曲線來看，vad 的輸出結果就會更不準確,噪聲殘留增加。vad 不同的權重，導致降噪殘留以及失真也是不一樣的，在訓練測試過程，有條件自己修改測試的情況下，可以自己測試效果。

4、總結來說，vad 影響效果，特別是，當修改vad 計算方式以及權重，使得訓練過程vad 的準確率更高時，往往會影響影響使摩擦音的語音損傷加重。

歡迎大家加音頻算法分享討論羣：153268894 （作者 zeark）。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

針對rnnoise vad 分享

容器中nginx無法使用同一個網絡下的容器域名

Python: SunMoonTimeCalculator

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

NETCore中實現一個輕量無負擔的極簡任務調度ScheduleTask

docker使用特定的網絡

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

nodejs學習07——API

避免DbContext同時在多個線程調用

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

深度學習抑制嘯叫

python 數據處理4----print 耗時問題

webrtc 讀寫文件操作3------- 錄音mic 文件

音頻傳輸 rs 和red 的使用比較

python 數據處理3----讀取txt 一列數據寫入excel 文件

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結