語音的SNR計算以及降噪後的計算

原創

2020-02-21 12:51

兩個關於降噪前後的語音SNR的計算參考
– SNR for audio .wav files and objective measures for evaluating filtering techniques
– How to calculate SNR of signals in MATLAB?

SNR計算
S1 = 原始乾淨語音
N1 = 噪聲.
S2 = S1 + N1 (帶噪語音)
S3 = 增強後的語音（使用某種算法降噪）
N2 = S3 - S1 (增強後語音中的殘留噪聲)
SNR的計算公式爲（dB）
$SNR = 10{\log _{10}}\frac{{{{\left\| {signal} \right\|}^2}}}{{{{\left\| {noise} \right\|}^2}}}$

SDR的計算公式爲
$SDR = 10{\log _{10}}\frac{{{{\left\| {Xc} \right\|}^2}}}{{{{\left\| {X - Xc} \right\|}^2}}}$
其中 $X_c$ 爲帶噪語音中的乾淨分量， $X$ 爲帶噪語音， $X_c - X$ 爲帶噪語音中的噪聲分量。計算SNR提升量：
$SNR(afterEnhanced) - SNR(beforeEnhanced) = 10{\log _{10}}\frac{{{{\left\| {S1} \right\|}^2}}}{{{{\left\| {N2} \right\|}^2}}} - 10\log 10\frac{{{{\left\| {S1} \right\|}^2}}}{{{{\left\| {N1} \right\|}^2}}}$
$\begin{array}{l} SDR(afterEnhanced) - SDR(beforeEnhanced) = 10{\log _{10}}\frac{{{{\left\| {S1} \right\|}^2}}}{{{{\left\| {S3 - S1} \right\|}^2}}} - 10\log 10\frac{{{{\left\| {S1} \right\|}^2}}}{{{{\left\| {S2 - S1} \right\|}^2}}}\\ = 10{\log _{10}}\frac{{{{\left\| {S1} \right\|}^2}}}{{{{\left\| {N2} \right\|}^2}}} - 10\log 10\frac{{{{\left\| {S1} \right\|}^2}}}{{{{\left\| {N1} \right\|}^2}}} \end{array}$
從公式上看，兩者完全相同。
SDR是（輸入信號的功率）和（輸入信號與增強信號之差的功率比），與SNR是一樣的，在語音增強中，他們都反應了整體的性能。SDR的性能可以反應SNR的性能.
另外，在下面文獻中也有類似的結論

Huang, Po-Sen, et al. “Joint optimization of masks and deep recurrent neural networks for monaural source separation.” IEEE/ACM Transactions on Audio, Speech, and Language Processing (TASLP) 23.12 (2015): 2136-2147.

SDR是輸入信號的功率與輸入信號與重構信號之差的功率之比。因此，SDR與經典的測量“信噪比”(SNR)完全相同，SDR反映了整體的分離性能。