原创 語音信號特徵提取預處理

語音信號是一種常見的時間序列,它以離散信號的形式被編碼,然後使用一定的文件格式來存儲,例如”.wav”。在當前與語音有關的應用中,出了單純的錄製、不做任何處理之後播放之外,幾乎所有的應用都要涉及到語音特徵的提取,例如語音文本轉換、

原创 語音信號特徵提取時域特徵(待續)

語音信號特徵提取<二>時域特徵(待續) 事實上,因爲語音信號的大多數處理都是在組幀之後進行的。組幀之後,幀序號就代表了時間先後。所以沒有多少特徵可以在時間域進行提取。常見的幾個時域特徵分別是:幅值、過零率以及直流偏置、能量以及線性

原创 語音識別:理論與實踐

寫在前面 英文版電子書:http://pan.baidu.com/s/1o8x82jo 密碼:zmja 回饋社區, 供學習交流,不足之處請讀者各位批評指出. 這篇文章是一項系統工程,會耗費很多心力.不支持非授權轉載,更不支持抄襲

原创 基於TensorFlow的音頻分析

基於TensorFlow的音頻分析 本文主要梳理一下使用機器學習的方法進行音頻分析的基本操作,並且僅用TensorFlow 實現從特徵提取到模型訓練的整個過程。 預計三月份之前完成。 ——————2019年2月25日16:08:55—