降噪測試過程中，測試語音選擇的思考

原創

zeark

2019-04-17 14:18

最近一直在測試降噪效果，也花了很多時間，借鑑同事以及資料，自己通過測試比較，有一些感悟，分享出來，希望音頻算法的同行一起討論。

降噪效果測試，正常情況我們會更多注重在噪聲分類上面，往往忽略了語音音素的選擇，這裏我分享下，其實音素在降噪效果的比較中，我們應該要重視起來，以下我先來談談一些音素的區別以及降噪的影響：

1、幾種音素的分類：

濁音：指發音時聲帶有震動的音素,比如au,o。

清音：與濁音相反，主要是通過通過氣流來發音，聲帶不震動，比如：s,p。

元音：發音過程中由氣流通過口腔而不受阻礙發出的音，分類有雙元音，半元音。

輔音：與元音相對，氣流在口腔或咽頭受到阻礙而形成的音，分類有鼻音，鼻塞音，摩擦音等。

2、降噪主觀測試序列音素的選擇：

在降噪過程，如果條件合適，我們的測試訓練需要包括所有的音素，並且需要保持3倍以上的量，當然，正常情況下，我們肯定很難做到這麼多的測試序列一遍一遍的聽，根據我的感受，我們至少需要包含以下幾種：

中文測試：中文發音，語音的持續時間比較長，很多降噪算法對音素的損傷偏小，但是我們還是需要確保我們的測試序列中包含足夠多的清音，比如：4，7，10，服等。

英文測試：相對於中文，英文每一個音素的發音延續時長就要短很多，清音出現的概率也更大，所以對英文測試時，我們就需要包含更多的音素，而且需要包含重讀、輕讀的單詞，比如s 發音在單詞前面，中間以及後面。還需要特別注意閉塞音：濁閉音：發音時長往往特別短10～20ms,能量往往還比較低，在做瞬時噪聲處理時，把握不好就會損傷嚴重，清閉塞音：40～100ms,這個時間相對也比較短，而且頻譜上往往就是一根豎線，在噪聲處理時也很容易造成損傷。另外就是摩擦音，由於能量強度低，頻譜平坦，即使一些對平穩噪聲降噪的方法，也會很容易對這部分發音損傷。

snr: 語音測試訓練，不同信噪比的帶噪語音，對測試失真也很重要。

歡迎大家加音頻算法分享討論羣：153268894 （作者 zeark）。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

降噪測試過程中，測試語音選擇的思考

深度學習抑制嘯叫

python 數據處理4----print 耗時問題

webrtc 讀寫文件操作3------- 錄音mic 文件

音頻傳輸 rs 和red 的使用比較

python 數據處理3----讀取txt 一列數據寫入excel 文件

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結