rnnoise 48k採樣率 轉16k採樣率有沒有必要?

1、關於rnnoise ,因爲語音增強大部分場景都是16k,所以很多人的就會想要16k 的模型,而作者提供的是48k的模型,

那到底有沒有必要從新訓練成16k 的呢?

優點:

a、我們先來分析一下代碼結構,從48k 降低到16k,fft 可以從960 降低到320,其他代碼基本不會有效率上的減少。

b、可以減少一次上採樣到48k以及一次下采樣16k。

缺點:

a、pitch 濾波的去諧波能力降低,fft後的分辨率下降,導致算法的效果降低。

結論:如果對效率不是那麼追求的應用,最好還是使用48k來處理!

rnnoise 具體訓練、應用,測試,技術優化,歡迎大家加音頻算法討論羣:153268894 (作者 zeark)。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章