針對rnnoise vad 分享

1、首先,提取特徵點,通過簡單的能量的方式來計算vad,這是很有效的方式,因爲語音源就已經確保都是非常乾淨的語音。從測試的結果來看,準確率也還可以,但是並沒有想象的那麼高,而且很明顯存在滯後以及尾音超前,所以就決定了vad 的效果不會很好。

2、在訓練模型時,正因爲vad 的效果不會太好,所以設計的訓練單元也就不是很多,對於vad 的輸出,特別是低信噪比的輸出結果就很不理想,在訓練過程,針對vad  的權重也設置的非常的低,這是非常合理的。

3、通過修改vad 以及權重,對整個訓練的影響非常的大,比如修改提取特徵點時,計算vad 的方法,使得vad 更準確,訓練後效果失真更小,但是通過訓練過程的曲線來看,vad 的輸出結果就會更不準確,噪聲殘留增加。vad 不同的權重,導致降噪殘留以及失真也是不一樣的,在訓練測試過程,有條件自己修改測試的情況下,可以自己測試效果。

4、總結來說,vad 影響效果,特別是,當修改vad 計算方式以及權重,使得訓練過程vad 的準確率更高時,往往會影響影響使摩擦音的語音損傷加重。

歡迎大家加音頻算法分享討論羣:153268894 (作者 zeark)。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章