語音特徵提取: MFCC的理解

1. 一般wav提取特徵的方式:

在這裏插入圖片描述

2. 什麼是MFCC:

在mel-spectrum上取對數,再做傅里葉變換得到的特徵,就是MFCCs。

這個過程可以概括爲對mel-spectrum求倒譜。

3. 什麼求倒譜:

求倒譜 就是對頻譜取對數,再做傅里葉變換,又回去了。

實際上是爲了獲取頻譜的包絡,包絡這個東西是非常用途很廣。

4. 什麼是頻譜的包絡:

就是頻譜裏面主要頻率成分的連線的平滑曲線,就是一段聲音裏面頻率振幅高的那些頻率的連線。
包絡就是頻率主要成分振幅的變化。

5.如何獲取頻譜的包絡:

包絡就是頻率主要成分振幅的變化。可以通過幅度解調的方法。就是這個變化是低頻的。
對頻譜做傅里葉變化,過濾低頻的成分,就是包絡的信息。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章