語音識別:理論與實踐

寫在前面

  • 英文版電子書:http://pan.baidu.com/s/1o8x82jo 密碼:zmja
  • 回饋社區, 供學習交流,不足之處請讀者各位批評指出.
  • 這篇文章是一項系統工程,會耗費很多心力.不支持非授權轉載,更不支持抄襲.
  • 從打算做這件事情到現在,一晃兩年多時間過去了,積累了一段時間,2019年12月4日重新出發,主要內容要有所調整,不以這本書爲主了.

本文的寫作時序如下:

  • 2019.12.04:開始chapter 0

0.自動語音識別概述

自動語音識別(ASR, automatic speech recognition)就是使用技術把人類語音轉變成文字的過程,又名STT(speech to text).雖然目前已經有了大量的商用語音識別系統,它們廣泛地存在於各種各樣的只能交互系統中,極大程度地豐富、方便了人們的日程生活.但是先存語音識別系統的性能相對是比較有限的,當然這是相對於我們對ASR系統的理想期待.
  語音識別發展到今天,凝結着全世界衆多科學家和工程師的智慧.從上世紀五十年代給予模板匹配的孤立刺識別到今天的大規模詞彙語音識別,經歷了一個漫長的過程.語音識別的發展史,就是算法、算力和數據這個鐵三角隨着時間的變化而螺旋式發展的濃縮.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章