李宏毅《Speech Recognition》学习笔记3 - Beam Search

最近在学习语音识别的知识,发现李宏毅老师今年也出了相应的视频,相应的课件可以从下面的位置获取:http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.html

Youtube视频:
https://youtu.be/AIKu43goh-8
https://youtu.be/BdUeBa6NbXA
https://youtu.be/CGuLuBaLIeI
课件:
http://speech.ee.ntu.edu.tw/~tlkagk/courses/DLHLP20/ASR%20%28v12%29.pdf

Beam Search只是课件中的一小部分,之所以单独提出来,是因为前几天才看过,又看李宏毅老师的视频,觉得讲的通俗易懂,值得推荐。

在这里插入图片描述
上图中,红色路径称为Greedy Decoding,本质是寻找当前最大概率的路径,也就是局部最优解,而不是最优解。其中,绿色路径是全局最优解。

为了解决这个问题,每次搜索时,保留B个最优分支,如下图,B=2时,就可以得到全局最优解。
在这里插入图片描述
Beam Seach的beam size是可以调整的参数,参数的调整会影响到最优解的结果。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章