李宏毅《Speech Recognition》學習筆記3 - Beam Search

最近在學習語音識別的知識,發現李宏毅老師今年也出了相應的視頻,相應的課件可以從下面的位置獲取:http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.html

Youtube視頻:
https://youtu.be/AIKu43goh-8
https://youtu.be/BdUeBa6NbXA
https://youtu.be/CGuLuBaLIeI
課件:
http://speech.ee.ntu.edu.tw/~tlkagk/courses/DLHLP20/ASR%20%28v12%29.pdf

Beam Search只是課件中的一小部分,之所以單獨提出來,是因爲前幾天纔看過,又看李宏毅老師的視頻,覺得講的通俗易懂,值得推薦。

在這裏插入圖片描述
上圖中,紅色路徑稱爲Greedy Decoding,本質是尋找當前最大概率的路徑,也就是局部最優解,而不是最優解。其中,綠色路徑是全局最優解。

爲了解決這個問題,每次搜索時,保留B個最優分支,如下圖,B=2時,就可以得到全局最優解。
在這裏插入圖片描述
Beam Seach的beam size是可以調整的參數,參數的調整會影響到最優解的結果。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章