如有不當之處歡迎批評指正
這篇文章主要想簡單地談一下評估音質的方法。對一段含噪語音降完噪之後,想評估一下其音質,最常想到的方法就是使用 pesq (perceptual evaluation of speech quality) 工具對其進行打分,而計算 pesq 得分需要事先知道含噪語音中的純乾淨語音成分,這種音質評估方法就稱爲有參考音質評估。
而降完噪之後的信號其實包含兩部分:語音成分和噪聲成分, 如何單獨評估降噪算法對乾淨語音的失真以及對噪聲的降噪量那。當然,需要先從降完噪之後的信號中分離出語音成分和噪聲成分,下面介紹一種簡單的分離方法:
其中,
: 表示降完噪的信號
: 表示降完噪信號中的語音成分
: 表示降完噪信號中的噪聲成分
: 表示事先知道的含噪語音中的純乾淨語音成分
: 表示和的點積操作
: 表示的2範數的平方
這種做法的思想是將降完噪之後的信號投影到乾淨語音上。分離出降完噪信號中的語音成分和噪聲成分後就能進一步估計降噪算法對語音的失真以及對噪聲的降噪量了。
下面給個例子看一下分離效果:
參考文獻
[1] Vincent E , Gribonval R , Fevotte C . Performance measurement in blind audio source separation[J]. IEEE Transactions on Audio, Speech and Language Processing, 2006, 14(4):1462-1469.