rnnoise 總共提取了42個輸入特徵點:
a、針對輸⼊入信號bark 22個頻帶的能量量做dct變換,得到22個BFCC係數。
b、針對22箇中的前六個即1.2k 做導數處理,針對 當前及過去三幀處理理爲(增加12個特徵點):
6個:An+A(n-1)+A(n-2);
+6個:An -A(n-2);
+6個:An +A(n-2)-2A(n-1)。
c、針對基⾳週期相關性,做dct變換,得到前6組帶的係數以及一個基⾳週期的 係數(增加一個特徵點)。
d、通過計算過去8幀頻帶的差異值之和,求得穩定性係數1個(一個特徵點)。
特徵點的提取主要是考慮:
1、採樣BFCC係數,是因爲BFCC在降噪方面的效果比MFCC更好。
2、基音週期系數,主要因爲噪聲會導致基因週期變低,人聲中濁音具有明顯的週期性,噪聲不具有。
rnnoise 具體訓練、應用,測試,技術優化,歡迎大家加音頻算法討論羣:153268894 (作者 zeark)。