降噪測試過程中,測試語音選擇的思考

最近一直在測試降噪效果,也花了很多時間,借鑑同事以及資料,自己通過測試比較,有一些感悟,分享出來,希望音頻算法的同行一起討論。

降噪效果測試,正常情況我們會更多注重在噪聲分類上面,往往忽略了語音音素的選擇,這裏我分享下,其實音素在降噪效果的比較中,我們應該要重視起來,以下我先來談談一些音素的區別以及降噪的影響:

1、幾種音素的分類:

濁音:指發音時聲帶有震動的音素,比如au,o。

清音:與濁音相反,主要是通過通過氣流來發音,聲帶不震動,比如:s,p。

元音:發音過程中由氣流通過口腔而不受阻礙發出的音,分類有雙元音,半元音。

輔音:與元音相對,氣流在口腔或咽頭受到阻礙而形成的音,分類有鼻音,鼻塞音,摩擦音等。

2、降噪主觀測試序列音素的選擇:

在降噪過程,如果條件合適,我們的測試訓練需要包括所有的音素,並且需要保持3倍以上的量,當然,正常情況下,我們肯定很難做到這麼多的測試序列一遍一遍的聽,根據我的感受,我們至少需要包含以下幾種:

中文測試:中文發音,語音的持續時間比較長,很多降噪算法對音素的損傷偏小,但是我們還是需要確保我們的測試序列中包含足夠多的清音,比如:4,7,10,服等。

英文測試:相對於中文,英文每一個音素的發音延續時長就要短很多,清音出現的概率也更大,所以對英文測試時,我們就需要包含更多的音素,而且需要包含重讀、輕讀的單詞,比如s 發音在單詞前面,中間以及後面。還需要特別注意閉塞音:濁閉音:發音時長往往特別短10~20ms,能量往往還比較低,在做瞬時噪聲處理時,把握不好就會損傷嚴重,清閉塞音:40~100ms,這個時間相對也比較短,而且頻譜上往往就是一根豎線,在噪聲處理時也很容易造成損傷。另外就是摩擦音,由於能量強度低,頻譜平坦,即使一些對平穩噪聲降噪的方法,也會很容易對這部分發音損傷。

snr: 語音測試訓練,不同信噪比的帶噪語音,對測試失真也很重要。

歡迎大家加音頻算法分享討論羣:153268894 (作者 zeark)。

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章