rnnoise 降噪特征点分析

rnnoise  总共提取了42个输入特征点:
a、针对输⼊入信号bark 22个频带的能量量做dct变换,得到22个BFCC系数。

b、针对22个中的前六个即1.2k 做导数处理,针对 当前及过去三帧处理理为(增加12个特征点):
6个:An+A(n-1)+A(n-2);
+6个:An -A(n-2);
+6个:An +A(n-2)-2A(n-1)。

c、针对基⾳周期相关性,做dct变换,得到前6组带的系数以及一个基⾳周期的 系数(增加一个特征点)。
d、通过计算过去8帧频带的差异值之和,求得稳定性系数1个(一个特征点)。

 

特征点的提取主要是考虑:

1、采样BFCC系数,是因为BFCC在降噪方面的效果比MFCC更好。

2、基音周期系数,主要因为噪声会导致基因周期变低,人声中浊音具有明显的周期性,噪声不具有。

rnnoise 具体训练、应用,测试,技术优化,欢迎大家加音频算法讨论群:153268894 (作者 zeark)。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章