rnnoise 48k采样率 转16k采样率有没有必要?

1、关于rnnoise ,因为语音增强大部分场景都是16k,所以很多人的就会想要16k 的模型,而作者提供的是48k的模型,

那到底有没有必要从新训练成16k 的呢?

优点:

a、我们先来分析一下代码结构,从48k 降低到16k,fft 可以从960 降低到320,其他代码基本不会有效率上的减少。

b、可以减少一次上采样到48k以及一次下采样16k。

缺点:

a、pitch 滤波的去谐波能力降低,fft后的分辨率下降,导致算法的效果降低。

结论:如果对效率不是那么追求的应用,最好还是使用48k来处理!

rnnoise 具体训练、应用,测试,技术优化,欢迎大家加音频算法讨论群:153268894 (作者 zeark)。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章