1. 一般wav提取特徵的方式:
2. 什麼是MFCC:
在mel-spectrum上取對數,再做傅里葉變換得到的特徵,就是MFCCs。
這個過程可以概括爲對mel-spectrum求倒譜。
3. 什麼求倒譜:
求倒譜 就是對頻譜取對數,再做傅里葉變換,又回去了。
實際上是爲了獲取頻譜的包絡,包絡這個東西是非常用途很廣。
4. 什麼是頻譜的包絡:
就是頻譜裏面主要頻率成分的連線的平滑曲線,就是一段聲音裏面頻率振幅高的那些頻率的連線。
包絡就是頻率主要成分振幅的變化。
5.如何獲取頻譜的包絡:
包絡就是頻率主要成分振幅的變化。可以通過幅度解調的方法。就是這個變化是低頻的。
對頻譜做傅里葉變化,過濾低頻的成分,就是包絡的信息。