語音信號處理1

簡單歷史

語音信號處理可以說是從1940年前後Dudley的聲碼器和Potter等人的可見語音開始的。

20世紀60年代初期,由於Faut和Stevens的努力,奠定了語音生成理論的基礎,在此基礎上語音合成的研究得到了紮實的進展。

60年代中期形成的一系列數字信號處理方法和技術,如數字濾波器、快速傅里葉變換(FFT)等成爲語音信號數字處理的理論和技術基礎。

在方法上,隨着電子計算機的發展,以往的以硬件爲中心的研究逐漸轉移到以軟件爲主的處理研究。

然而,語音識別技術難度使得該技術在70年代的發展幾乎停滯不前。

80年代開始出現的語音識別處理技術產品化的熱潮,由於矢量化、隱馬爾科夫模型和人工神經網絡等相繼被應用於語音信號處理

90年代以來語音識別逐漸從實驗室走向實用化

九大主要研究方向

語音增強:從噪聲背景中提取有用的語音信號,抑制、降低噪聲干擾的技術。

說話人識別:力求通過語音信號中的語義信息平均化,挖掘出包含在語音信號中的說話人的個性因素,強調不同人之間的特徵差異。

語音識別:讓機器聽懂人說的話

語音情感識別:從語音中識別出人的情感狀態

語音合成與轉換:將任意文字信息實時轉換爲標準流暢的語音朗讀出來

聲源定位:系統接受到的語音信號相對於接收傳感器是來自什麼方向和什麼距離的。

語音隱藏:將特定的信息嵌入到數字化的語音中。

語音編碼:方便數字傳輸和數字存儲

聲反饋抑制:揚聲器播出的聲音在被受話方聽到的同時,也通過多種路徑被送話器拾取到。在很多情況下會產生回波,嚴重影響語音的清晰度,更爲致命的是,當反饋嚴重時會產生自激嗷叫,使得系統無法工作。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章